查看: 3800|回复: 18
[智能音箱]
目前比较好的语音控制hass的方案是什么
[复制链接]
风行草
风行草
当前离线
积分348
金钱284
威望0
贡献0
HASS币0
5
主题59
回帖348
积分
中级会员
中级会员, 积分 348, 距离下一级还需 152 积分
中级会员, 积分 348, 距离下一级还需 152 积分
积分348
金钱284
HASS币0
发消息
电梯直达
楼主
发表于 2025-1-16 11:25:27
|
只看该作者
|倒序浏览
|阅读模式
目前在hass的app里已经实现语音控制了,现在需要一个设备放客厅,能直接将我的语音命令传给hass的assist并执行(或者stt成文本传给hass也行)
想问问目前比较好,响应延迟比较低的方案有哪些,最好可以不需要唤醒词的
(最好是有成品可以接入的,自己焊的烧录的玩不来)
收藏0
回复
使用道具
举报
bugensui
bugensui
当前在线
积分9245
金钱6301
威望0
贡献0
HASS币80
181
主题2748
回帖9245
积分
元老级技术达人
积分9245
金钱6301
HASS币80
发消息
沙发
发表于 2025-1-16 11:53:05
|
只看该作者
本帖最后由 bugensui 于 2025-1-16 11:54 编辑
ha语音助手官方硬件,或者苹果homepod mini,都需要唤醒词
回复
使用道具
举报
xxlxmd
xxlxmd
当前离线
积分1558
金钱1338
威望0
贡献0
HASS币0
14
主题206
回帖1558
积分
论坛技术达人
积分1558
金钱1338
HASS币0
发消息
板凳
发表于 2025-1-17 11:32:30
|
只看该作者
没有唤醒词 很容易误触 而且很费计算能力
回复
使用道具
举报
风行草
风行草
当前离线
积分348
金钱284
威望0
贡献0
HASS币0
5
主题59
回帖348
积分
中级会员
中级会员, 积分 348, 距离下一级还需 152 积分
中级会员, 积分 348, 距离下一级还需 152 积分
积分348
金钱284
HASS币0
发消息
地板
楼主|
发表于 2025-1-17 13:18:52
|
只看该作者
xxlxmd 发表于 2025-1-17 11:32
没有唤醒词 很容易误触 而且很费计算能力
需要唤醒词也可以,有什么不错的方案推荐吗
回复
使用道具
举报
itispip
itispip
当前离线
积分1598
金钱1208
威望0
贡献0
HASS币0
25
主题365
回帖1598
积分
金牌会员
金牌会员, 积分 1598, 距离下一级还需 1402 积分
金牌会员, 积分 1598, 距离下一级还需 1402 积分
积分1598
金钱1208
HASS币0
发消息
5#
发表于 2025-1-17 13:55:39
|
只看该作者
本帖最后由 itispip 于 2025-1-17 13:58 编辑
当然就是官方的硬件啦。没有唤醒词是不可能啊,除非你买个十几万的设备跑本地大模型,一刻不停的分析环境声音,然后你还要训练它怎么什么时候该回应什么时候不是在对它说。
官方对比小爱如下:
https://bbs.hassbian.com/thread-28192-1-1.html
回复
使用道具
举报
风行草
风行草
当前离线
积分348
金钱284
威望0
贡献0
HASS币0
5
主题59
回帖348
积分
中级会员
中级会员, 积分 348, 距离下一级还需 152 积分
中级会员, 积分 348, 距离下一级还需 152 积分
积分348
金钱284
HASS币0
发消息
6#
楼主|
发表于 2025-1-17 14:01:01
|
只看该作者
itispip 发表于 2025-1-17 13:55
当然就是官方的硬件啦。没有唤醒词是不可能啊,除非你买个十几万的设备跑本地大模型,一刻不停的分析环境声 ...
拜读过大佬的帖子,官方的哪哪都好,就是滤音这块是比较纠结的点
回复
使用道具
举报
fung1006
fung1006
当前离线
积分2700
金钱2294
威望0
贡献0
HASS币30
2
主题399
回帖2700
积分
金牌会员
金牌会员, 积分 2700, 距离下一级还需 300 积分
金牌会员, 积分 2700, 距离下一级还需 300 积分
积分2700
金钱2294
HASS币30
发消息
7#
发表于 2025-1-21 17:14:44
|
只看该作者
本帖最后由 fung1006 于 2025-1-21 17:28 编辑
home assistant voice pe 配合 deepseek API就可以無限可能
登录/注册后可看大图
Screenshot 2025-01-21 at 5.25.47 PM.png (835.43 KB, 下载次数: 0)
下载附件
2025-1-21 17:26 上传
登录/注册后可看大图
Screenshot 2025-01-21 at 5.25.09 PM.png (283.5 KB, 下载次数: 0)
下载附件
2025-1-21 17:26 上传
回复
使用道具
举报
c1pher_小愚
c1pher_小愚
当前离线
积分6820
金钱5284
威望0
贡献0
HASS币70
32
主题1479
回帖6820
积分
元老级技术达人
积分6820
金钱5284
HASS币70
发消息
8#
发表于 2025-1-22 10:41:02
|
只看该作者
响应延迟比较低,这个要求不太明确 多少秒是你要求的低
走大模型调用,如果只看控制命令/工具调用,基本损耗在6-10秒。主要慢在stt(3-5秒),本地执行意图的话可以秒级,云端执行意图的话3-5秒,
如果是对话,那就更慢了,stt tts都会比较费时间(而且有时候stt还会翻译错),再加上大模型处理的时间,看你具体的对话长度。
根小爱天猫精灵或者大模型app,在实际使用上还是有差距的。 什么时候支持流式处理了,速度上会再有一次飞跃
回复
使用道具
举报
风行草
风行草
当前离线
积分348
金钱284
威望0
贡献0
HASS币0
5
主题59
回帖348
积分
中级会员
中级会员, 积分 348, 距离下一级还需 152 积分
中级会员, 积分 348, 距离下一级还需 152 积分
积分348
金钱284
HASS币0
发消息
9#
楼主|
发表于 2025-1-22 13:35:17
|
只看该作者
25989406 发表于 2025-1-22 10:41
响应延迟比较低,这个要求不太明确 多少秒是你要求的低
走大模型调用,如果只看控制命令/工具调用,基本损 ...
我目前用的deepseek 和本地stt 大概三四秒响应 想降到两秒以内(确实是stt比较花时间 我是n100)
回复
使用道具
举报
lichao622
lichao622
当前离线
积分3005
金钱2319
威望0
贡献0
HASS币0
77
主题604
回帖3005
积分
论坛元老
积分3005
金钱2319
HASS币0
发消息
10#
发表于 2025-1-23 13:39:54
|
只看该作者
大伙都用啥 stt和tts呀
回复
使用道具
举报