IA DE RECONOCIMIENTO DE VOZ EN TU PC?

Dark

🔥root313🔥
Staff
Moderador
Paladín de Nodo
Jinete de Nodo
Burgués de Nodo
Noderador
Nodero
Noder Pro
Noder
Últimamente me están saliendo bastantes vídeos con el meme de Jarvis de Iron Man, de peña que con ciertos sonidos o palabras hacen que se ejecuten automatizaciones en su PC, alguien sabe qué es? Algún repositorio famoso? Una mezcla de algo de reconocimiento de voz y alguna IA de estos tipo OpenCLAW o asistentes personales?

Me iría bien montarme ciertas automatizaciones por voz.
 

Cabali11

Miembro muy activo
Noder
Hay varios repos de eso rulando por github que tienen todo ya montado, échales un ojo si quieres:
 

stormsex

Miembro muy activo
Nodero
Noder
Últimamente me están saliendo bastantes vídeos con el meme de Jarvis de Iron Man, de peña que con ciertos sonidos o palabras hacen que se ejecuten automatizaciones en su PC, alguien sabe qué es? Algún repositorio famoso? Una mezcla de algo de reconocimiento de voz y alguna IA de estos tipo OpenCLAW o asistentes personales?

Me iría bien montarme ciertas automatizaciones por voz.
Es algo del Openclaw ai, sí. Tengo que echarle un vistazo
 

Dark

🔥root313🔥
Staff
Moderador
Paladín de Nodo
Jinete de Nodo
Burgués de Nodo
Noderador
Nodero
Noder Pro
Noder
Claude es tremnda mierda con spyware cuidao
Y que tiene que ver Claude con lo que he dicho? Cabrón, para usar Claude Code para empezar necesitas el plan de 20€ mínimo, y encima no tiene nada de reconocimiento de voz, puede ejecutar comandos que tú le pidas en un prompt, sí, pero el reconocimiento de voz te lo pasas por el culo no?
 

Dark

🔥root313🔥
Staff
Moderador
Paladín de Nodo
Jinete de Nodo
Burgués de Nodo
Noderador
Nodero
Noder Pro
Noder
Hay varios repos de eso rulando por github que tienen todo ya montado, échales un ojo si quieres:
Hmmm, prefiero más bien montármelo yo desde 0.
 

Citro

Miembro muy activo
Noder
Y que tiene que ver Claude con lo que he dicho? Cabrón, para usar Claude Code para empezar necesitas el plan de 20€ mínimo, y encima no tiene nada de reconocimiento de voz, puede ejecutar comandos que tú le pidas en un prompt, sí, pero el reconocimiento de voz te lo pasas por el culo no?
Paranoia mia, he leide claude en donde ponía openclaw y pensaba que habia alguien haciendolo con claude jaja, si te lo montas tu desde 0 envia cap de como queda. A mi me sigue sin convencer la idea de automatizar a full el pc
 
  • Like
Reacciones : Dark

g0dsito

Miembro muy activo
Noder
Últimamente me están saliendo bastantes vídeos con el meme de Jarvis de Iron Man, de peña que con ciertos sonidos o palabras hacen que se ejecuten automatizaciones en su PC, alguien sabe qué es? Algún repositorio famoso? Una mezcla de algo de reconocimiento de voz y alguna IA de estos tipo OpenCLAW o asistentes personales?

Me iría bien montarme ciertas automatizaciones por voz.
Se combinan ambas, normalmente los que tienen un buen proyecto usan una aplicación para abrir carpetas, archivos o ventanas, y se puede usar ElevenLabs para la locución, que la nueva V3 está muy bien y funciona de lujo.

Tienen incluso modelos de low latency que casi en tiempo real funciona y la voz es muy real.

La página te da unos tokens gratis, y suficiente para probar, pero si os mola os traigo alguna promo que te da tokens gratis para "startups"..
 

Dark

🔥root313🔥
Staff
Moderador
Paladín de Nodo
Jinete de Nodo
Burgués de Nodo
Noderador
Nodero
Noder Pro
Noder
Se combinan ambas, normalmente los que tienen un buen proyecto usan una aplicación para abrir carpetas, archivos o ventanas, y se puede usar ElevenLabs para la locución, que la nueva V3 está muy bien y funciona de lujo.

Tienen incluso modelos de low latency que casi en tiempo real funciona y la voz es muy real.

La página te da unos tokens gratis, y suficiente para probar, pero si os mola os traigo alguna promo que te da tokens gratis para "startups"..
A ver, a mi que el PC me hable me la pela, me interesa el Voice-to-Text¡ más que nada, y luego algo que pueda interpretar ciertas palabras y ejecutar x, ya sean automatizaciones que permite crear el programa con macros y movidas o simples scripts que yo le diga.
 

g0dsito

Miembro muy activo
Noder
A ver, a mi que el PC me hable me la pela, me interesa el Voice-to-Text¡ más que nada, y luego algo que pueda interpretar ciertas palabras y ejecutar x, ya sean automatizaciones que permite crear el programa con macros y movidas o simples scripts que yo le diga.
Conectar ElevenLabs para la voz, incluye Voice-to-text y si se conecta con OpenClaw o Claude Cowork.. Vas listo con eso.
 

Dark

🔥root313🔥
Staff
Moderador
Paladín de Nodo
Jinete de Nodo
Burgués de Nodo
Noderador
Nodero
Noder Pro
Noder
Conectar ElevenLabs para la voz, incluye Voice-to-text y si se conecta con OpenClaw o Claude Cowork.. Vas listo con eso.
Pero el ElevenLabs es lo de los tokens, no?