Home Assistant 2023: el año de la voz de Home Assistant

Home Assistant 2023: el año de la voz de Home Assistant

TL;DR: Nuestro objetivo para 2023 es permitir que los usuarios controlen Home Assistant en su propio idioma. Mike Hansen, creador de Rhasspy, se unió a Nabu Casa para liderar este esfuerzo. Comenzamos con la creación de una colección de oraciones que coinciden con la intención en todos los idiomas.

Por lo general, el mes de diciembre está destinado a reflejar. Sin embargo, ya lo hicimos el mes pasado cuando organizamos el State of the Open Home 2022. No solo reflexionamos, también anunciamos nuestro enfoque para el próximo año: 2023 será el año de la voz.

Nuestro objetivo para 2023 es permitir que los usuarios controlen Home Assistant en su propio idioma.

Es un objetivo grande y audaz, pero alcanzable con las limitaciones adecuadas. La cantidad de trabajo que se nos ha asignado se puede resumir de la siguiente manera:

Idiomas hablados veces acciones posibles

Nuestra prioridad número 1 es admitir diferentes idiomas. Hay suficientes proyectos que intentan crear un asistente de voz en inglés. Pero para nosotros, eso simplemente no es suficiente. Las personas deben poder hablar en su propio idioma, ya que es el idioma más accesible y el único aceptable para un asistente de voz para el hogar inteligente.

Para que la cantidad de trabajo que tenemos por delante sea manejable, limitaremos la cantidad de acciones posibles y nos centraremos en los aspectos básicos de la interacción con su hogar inteligente. Sin búsquedas web, llamadas o juegos de voz. ¡Y definitivamente nada de “por cierto”!

Comenzaremos con algunas acciones y construiremos los modelos de lenguaje en torno a eso. Home Assistant admite 62 idiomas diferentes en su interfaz de usuario. Y nuestro objetivo es admitir todos estos idiomas con voz. Creemos que podemos lograrlo aprovechando el activo más fuerte de Home Assistant: nuestra comunidad.

Nuestra historia con los asistentes de voz

Si sigue las noticias, puede parecer que los asistentes de voz han fallado. Amazon está listo para perder $ 10 mil millones en Alexa este año y está planeando despidos. Google también está reduciendo su soporte para el Asistente de Google, ya que está tratando de reducir costos. La verdad es que la voz, como la próxima plataforma informática que genera miles de millones de dólares en ingresos adicionales, ha fracasado. En cambio, los usuarios utilizan principalmente sus asistentes de voz para administrar listas de compras, programar temporizadores, reproducir música y controlar sus hogares. La voz ha fallado como fuente de ingresos, no ha fallado a sus usuarios.

Con Home Assistant siempre nos ha interesado la voz. Solíamos trabajar con Snips en el pasado, pero fueron adquiridos y cerrados. Trabajamos con Stanford en su plataforma Almond/Genie, pero es un proyecto impulsado por la investigación que nunca estuvo listo para la producción. Y sí, puede usar Home Assistant para enviar todos sus datos a las nubes de Google y Amazon para aprovechar sus asistentes de voz, pero no debería tener que renunciar a su privacidad para encender las luces por voz.

El proyecto más prometedor que existe es Rhasspy, creado por Mike Hansen. Un proyecto que permite a las personas crear su propio asistente de voz local, que también puede vincularse con Home Assistant. Rhasspy se destaca de otros proyectos de voz de código abierto porque Mike no se enfoca solo en inglés. En cambio, su objetivo es hacer que funcione para todos. Esto va muy bien ya que Rhasspy ya admite 16 idiomas diferentes en la actualidad.

Con Home Assistant queremos hacer que una casa inteligente con privacidad y enfocada localmente esté disponible para todos. El enfoque de Mike con Rhasspy se alinea con Home Assistant, por lo que nos complace anunciar que Mike se unió a Nabu Casa para trabajar a tiempo completo en voz en Home Assistant.

Iterando al aire libre

Con Home Assistant preferimos que las cosas que estamos construyendo lleguen a las manos del usuario lo antes posible. Incluso la funcionalidad básica permite a los usuarios encontrar cosas que funcionan y no funcionan, permitiéndonos abordar la dirección si es necesario.

Un asistente de voz tiene muchas partes diferentes: detección de palabras calientes, voz a texto, reconocimiento de intenciones, ejecución de intenciones, texto a voz. Hacer cada trabajo en cada idioma es mucho trabajo. La parte más importante es el reconocimiento de la intención y la ejecución de la intención. Necesitamos ser capaces de comprender sus comandos y ejecutarlos.

Comenzamos a recopilar estas oraciones de comando en nuestro nuevo repositorio de intentos. Pronto impulsará la integración de conversación existente en Home Assistant, permitiéndole usar nuestra aplicación para escribir y decir comandos.

La integración de la conversación se expone en Home Assistant a través de una llamada de servicio y también está disponible a través de una API para aplicaciones o scripts externos. Esto permite a los desarrolladores experimentar con el envío de comandos desde varias fuentes, como un chatbot de Telegram.

Captura de pantalla del diálogo de conversación en Home Assistant

Cómo puedes ayudar

Para cada idioma, recopilamos oraciones de comandos que controlan su hogar inteligente en nuestro repositorio de intentos. Cada oración necesitará ser anotada con su intención.

Tomemos por ejemplo la oración: Turn on the bedroom lights. escríbelo como Turn on the {area} lights y se convierte en un mando genérico para encender todas las luces de una zona concreta. Ahora también debemos recopilar todas las demás variaciones.

Hemos creado un formato basado en YAML para declarar y probar estas oraciones. El siguiente paso es que te necesitamos 🫵

Para cada idioma vamos a necesitar uno o más líderes de idioma. Los líderes lingüísticos son responsables de revisar las contribuciones en su idioma y asegurarse de que sean gramaticalmente correctas. Si desea postularse para ser un líder lingüístico, únase a nosotros en #devs_voice en Discord o abre un problema en nuestro repositorio de intentos.

También necesitamos personas que quieran contribuir con oraciones en su idioma para ayudar a construir nuestra colección. Consulta nuestro repositorio de intents para saber cómo empezar.


Visto en