Авторизация
Регистрация

Напомнить пароль

XiaoZhi AI Voice Chat Robot Speaker Box

  1. Цена: 2 674 ₽
  2. Перейти в магазин
Некоторое время назад я с удивлением обнаружил, что китайцы вовсю торгуют заготовками для умных колонок\голосовых помощников, причём в куче разных вариантов и оформлений(но +- на одной аппаратной базе). Выбрав наиболее приличный(чисто визуально) вариант, я незамедлительно его заказал. Подробности под катом.

Вопрос самодельных безумных колонок в связке с HA длится достаточно долго. По сути, до недавнего времени вариантов было только два — либо M5 Stack Atom Echo, либо кастомный сумрачный DIY из рассыпухи. Насчет второго не в курсе, но Atom Echo у меня есть и он откровенно никакой, крайне тугой микрофон, крайне тихий динамик, не слышит нормально даже с полуметра и с того же полуметра необходимо прислушиваться, чтобы понять чего он там лопочет.
Затем — внезапно — разрабы HA выпустили Voice Assistant Preview Edition(я тут некоторое время назад публиковал обзор). Он прекрасен как рассвет, у него отличный дизайн и встроенный шумодав, он слышит меня даже из другой комнаты… Короче, он был на две головы выше всех вариантов и был бы идеален, если бы не цена.
Также параллельно SeeedStudio выпустили несколько девкитов с той же микрофонной сборкой и шумодавом, что и в Voice Assistant PE. В том числе самый ИМХО интересный с точки зрения колхозинга ReSpeaker Lite.
И да, я даже запилил на его базе колонку)
Впрочем, выигрыш по цене в сравнении с Voice Assistant PE вышел не слишком значительный, а девайс получился в чём-то лучше, но в чём-то и хуже. Потому обзор пилить я не стал(может, когда-нибудь потом).
В любом случае, теперь в продаже есть целая россыпь железок, довольно таки неплохих и куда как более дешёвых.

Конкретно купленный мной вариант называется Waveshare ESP32-S3-Touch-LCD-1.85C
Приходит в обычной картониевой коробке и антистатическом пакете
Кроме самой колонки в коробке плавают пара коннекторов с проводками и — опять же внезапно — аккумулятор отдельно.
Аккумулятор на 1000mAh и почему он не внутри колонки — сие тайна великая есть. Может, какие-то приколы с таможней, может есть варианты комплектации без аккумулятора. Не знаю.
При встряхивании колонки выяснилось, что внутри что-то активно болтается. Снимаем решётку на дне(сколупывается ногтем)
И выясняем что динамик тоже решил погулять(видимо, без аккума внутри одному скучно). Раскручиваем три винта.
И понимаем, что динамик должен был держаться на трёх каплях термосоплей, а верхняя часть колонки — это вполне себе отдельный модуль, который можно использовать самостоятельно. Даже распиновка красиво оформлена и наклеена — ребята явно вдохновлялись продукцией M5 Stack.
Откручиваем стойки
И встречаем внутри плату на базе МК ESP32-S3.
Выполнено аккуратно, UART и SPI выведены в разъёмы, есть слот под карту памяти(с аутентичным китайским отпечатком). Становится понятно, что боковые кнопки — это стандартные для всех девкитов BOOT и RST. Тумблер включения кстати просто разрывает линию от аккумулятора, при подключении к USB железка включается вне зависимости от его положения.
Из интересного — зоркий глаз может заметить некий разъём RTC — он нужен для подключения батарейки для питания RTC чипа (PCF85063). Вероятно, в каких-то задачах может пригодиться.
Также зоркий глаз мог заметить некий неподписанный потенциометр — он служит для подстройки громкости. Лично я крутить его не стал — оно в целом и так было настроено +- адекватно под комплектный динамик.
Для желающих больше подробностей — микрухи крупным планом и страничка производителя с описанием
Ну и раз уж мы дошли до этой точки — скручиваем короткие стойки и смотрим на огромное блестящее ничего с другой стороны платы
Тут живут только экранный шлейф и микрофон. Расположение микрофона ИМХО достаточно неудачное — слуховое окно у него выходит на первую сторону платы(см. прошлые фото, там дырочка подписанная), а значит он слушает в первую очередь внутреннее пространство колонки. Резонатор. Там громко. Фиговый листочек в виде перегородки, которую удерживали длинные стойки, не спасает. К этому вопросу чуть позже ещё вернёмся. Также в очередной раз зоркий глаз мог заметить, что микрофон только один. Шумодава нет и не предвидится.
Подключаем аккумулятор, собираем всё до кучи. Крепить динамик дополнительно не потребовалось, его плотно подпёр аккум. Зачем нужно было его подключать и клеить на термосопли, не подключая при этом аккумулятор — тоже загадка. Вид снизу на колонку в сборе.
Подаём питание, загружается китайская прошивка, которая наверное что-то умеет делать
Выяснять не стал, откровенно неинтересно. Мне нужен был голосовой помощник для HomeAssistant — и к счастью есть репозиторий под EspHome, где всё уже сделано за нас(ну почти)
github.com/RealDeco/xiaozhi-esphome/tree/main?tab=readme-ov-file
Там же есть список ссылок на другие подобные китайские недоколонки, которые этот проект поддерживает. Их прям много, на любой вкус
Для модуля по ссылке в шапке нужен этот ямл
github.com/RealDeco/xiaozhi-esphome/blob/main/devices/Waveshare/ESP32-S3-Touch-LCD-1.85C.yaml
Судя по всему, есть ещё вторая ревизия платы, отличается только экраном. Как их отличить не знаю. но если залить прошивку не для той — будет что-то такое
Также в ямл нужно будет внести несколько изменений. Во первых, если ваш экземпляр ESPHome работает в докере — надо прибить гвоздями правильную таймзону(т.е. в блоке time добавить timezone: «Europe/Moscow»(для Москвы, очевидно)
Также для нормального отображения кириллических символов нужно будет поменять шрифты
font_glyphsets: «GF_Cyrillic_Core»
font_family: Roboto
Также в allowed_characters можно повыпиливать всякие левые символы из других языков чтоб в логах при загрузке не сыпало ворнингами, но это не обязательно.
В начале ямла также есть несколько переменных, позволяющих настроить визуальное оформление
Посмотреть, что именно ставим можно в репозитории проекта в папке Images, я себе воткнул рисованую анимушную девочку(ибо почему нет?)
Прошиваем, запускаем, подключаем к HomeAssistant.
Процесс подключения колонки и настройки голосового ассистента уже был освещён в прошлом обзоре, второй раз тоже самое писать не вижу смысла ибо ничего не поменялось. По прежнему самый стабильный и производительный вариант — это VOSK с ограничением словаря для распознавания речи и piper для генерации.
Получаем такую вот приколюху

Для тех, у кого почему-то плохо работает ютьюб
На видео я произношу фразу-активатор, после чего прошу включить свет в мастерской. Колонка немножко думает и включает. Девочка на экране при этом хмурит личико, меняет позы и выдаёт запрос и ответ в диалоговых пузырях на чистом русском языке

Весь стандартный функционал при этом работает, можно попросить включить таймер

Для тех, у кого почему-то плохо работает ютьюб
На видео я произношу фразу-активатор, после чего прошу включить на 15 секунд. Появляется прогресс-бар и обратный отсчёт, по окончании включается звук будильника, который я останавливаю жамканьем экрана

Экран тут сенсорный, выступает в роли кнопки(аналогично той, что была на корпусе Voice PE), но почему-то одиночные тапы обрабатываются не всегда уверенно. На свайпы реагирует лучше
Можно спросить про погоду

Для тех, у кого почему-то плохо работает ютьюб
На видео я произношу фразу-активатор, после чего спрашиваю колонку «что там на улице?». Эта фраза у меня замаплена на запрос «погода», в результате колонка озвучивает, что же там таки на улице

Да, знаю, голос немного подкачал и плохо сочетается с анимушной девочкой, но единственный женский голос, доступный в Piper откровенно ну такой

Для тех, у кого почему-то плохо работает ютьюб
Происходит то же самое, что и на прошлом видео, только вместо голоса ruslan включен голос irina

Для воспроизведения музыки колонка подходит не очень хорошо, динамик откровенно не вывозит высокие, собственно так же, как и VoicePE. Плюс громокость тоже не бог весть. Можно попробовать покрутить подстроечный потенциометр, но на голосовые команды её хватает, а музыка тут точно мимо.

Для тех, у кого почему-то плохо работает ютьюб
На видео я включаю воспроизведение лунной сонаты на колонке. Играет паршивенько

Впрочем, если запускать поток с интернет-радио с вусмерть пережатым динамическим диапазоном, то играет приемлемо
В этом месте должно было быть видео, но в отличие от меня ютьюб сумел угадать песню с трёх нот и забанил ролик. За пределами РФ может воспроизводиться, но это не точно

На видео я произношу фразу-активатор и прошу колонку включить музыку. Фраза «Включи музыку» у меня забинжена на автоматизацию, которая запускает воспроизведение потока с интернет-радио на девайсе, который автоматизацию триггернул. Звучит уже получше

Но тут вылезает главный косяк — в момент воспроизведения колонка полностью нафиг глохнет, можно громко говорить фразу-активатор прямо в упор — ей по боку. Неудачное расположение микрофона плюс отсутствие шумодава.
В обычных же условиях чувствительность микрофона достаточно неплохая, с примерно трёх метров колонка меня слышит и реагирует. Если сравнивать лоб-в-лоб с самопалом на Respeaker Satellite, то у последнего чувствительность несколько выше, но не прям критично. Voice PE впрочем всё ещё вне конкуренции, из соседней комнаты слышит только он.

Для тех, у кого почему-то плохо работает ютьюб
На видео я отошёл от колонки на 3 метра и показываю, что она прекрасно меня слышит. На фоне происходит творческий бардак в мастерской, за что прошу прощения

Плавно переходим к выводам.
На мой вкус, по качеству работы в роли голосового помощника все ощупанные мною девайсы расположились в таком порядке:
1. HomeAssistant Voice PE (S тир, эталон, лучшее что сейчас могут купить деньги)
2. Respeaker Lite от Seeed Studio(но это голая плата и колонку из неё ещё нужно сделать. Не факт что выйдет удачно)
3. Обозревамый китаец
4. M5 Echo Atom (F тир, не надо это брать, проще принести из леса длинную палку и тыкать ей в выключатель, чем добиться от него внятной работы)

Но при этом данный китаец приезжает в виде почти готового устройства, с экранчиком, красивенький, в куче разных оформлений. И стоит вполне разумных денег. По сумме свойств думаю что на текущий момент он — оптимальный вариант по соотношению цена\качество.
Из недостатков — не самый удачный микрофон и не самый громкий динамик, но и то и другое на голову лучше чем у M5 Echo Atom. Из достоинств — всё остальное, прекрасный полуфабрикат для домашней автоматизации.
Всем спасибо за внимание!

UPD Маленький апдейт
Попробовал прикрутить Silero вместо Piper
github.com/Navatusein/Silero-TTS-Service
Пересобрал докер образ, поднял версию движка до 5-ой. Вкратце — ресурсов конечно жрёт больше, но апельсинка его по прежнему вывозит и голос стал приятней. Чуть позже оформлю там PR
Планирую купить +14 Добавить в избранное
+76 +92
свернутьразвернуть
Комментарии (65)
RSS
+
avatar
+1
  • Rokko
  • 19 ноября 2025, 11:09
Комиссионка победа. за 500 можно сбер колонку взять. Взял две штуки — голосом свет в комнатах включаю.
+
avatar
+15
  • 00svd00
  • 19 ноября 2025, 11:11
Но это как бы вообще другая экосистема. Перекатывать с HA на сберовское решение просто потому что в какой-то комиссионке колонки раздают — такое себе.
+
avatar
-2
  • Mach
  • 19 ноября 2025, 11:28
Так вроде есть интеграция для управления HA с колонок сбер.
+
avatar
+10
  • 00svd00
  • 19 ноября 2025, 11:32
Из того что я видел — управление полностью выносится на сторону облачных сервисов сбера. Т.е. не колонка добавляется в HA, а HA пробрасывается в салют. Со всеми ограничениями и завязкой на сторонную инфраструктуру. Мне такое не по душе, не вижу смысла — для того чтобы крутить HA+VOSK+Piper хватает дохлой копеечной Orange Pi Zero 3.
+
avatar
+11
  • val_sav
  • 19 ноября 2025, 11:29
весь смысл в том чтобы не яндекс и не сбер. я не хочу чтобы они меня слушали
плюс здесь надо руки приложить и голову, а значит уже интересно
+
avatar
+1
  • uh9lab
  • 19 ноября 2025, 12:57
Ну, Яндекс 2 и 3го поколения можно пробросить в HA через «облако» (наоборот тоже можно, но нафиг нужно) — и по части распознавания в условиях шума, говорят, им нет равных. Как раз заказал, буду пробовать. ESP хорошо работает в относительной тишине, а на фоне разговоров, ТВ и пр. теряется.
+
avatar
0
Ну, Яндекс 2 и 3го поколения можно пробросить в HA через «облако» (наоборот тоже можно, но нафиг нужно)
И что, они могут быть штатным голосовым ассистентом в HA? Я хочу ошибаться, но боюсь, что пока нет. В отличие от самодельных вариантов и HA Voice.
Мне бы вот и облачный вариант Алисы зашел бы, если бы была полноценная интеграция голосового ассистента, а не ручные костыли в духе проброса из HA в Яндекс.
+
avatar
+3
  • Kheamu
  • 19 ноября 2025, 12:15
Без интернета работать будет? А HA — да.
+
avatar
+2
  • Phanex
  • 19 ноября 2025, 12:38
Тут увы, для ии-помощников или мощный комп с мощной видеокартой, или внешнее подключение через апи. Иначе будет «медленно и печально».
+
avatar
+1
  • 00svd00
  • 19 ноября 2025, 12:42
Ну, на самом деле небольшие модели того же дипсика народ вполне успешно крутит на пятой апельсине — с вполне убедительной скоростью генерации. Другой вопрос — действительно ли оно надо. Лично мне гораздо ближе стабильное распознавание ограниченного набора команд без лишней самодеятельности.
+
avatar
0
  • rustamt
  • 19 ноября 2025, 15:03
я с несколько месяцев назад пробовал на роцкчипе rk3576(npu примерно такого же уровня как и в старшем rk3588 с 6 tops как в этой вашей апельсинке) гонять какие-то llm демки с мелкими моделями от deepseek, qwen от 1.5b до 7b параметров — скорость вроде и терпимая(пару токенов в секунду), но они бесполезные чуть менее чем полностью.

какую-то примитивную арифметику оно может осилить, а если например чуть более сложные задачки вроде рассчитать сколько выйдет воды из накопительного бачка при падении давления с 3 до 2 бар — оно пыхтит минут 10, генерирует две страницы текста размышлений и потом какую-то дичь выдает, так и не понял зачем бы я мог такое дома прикрутить.
+
avatar
+1
  • 00svd00
  • 19 ноября 2025, 15:17
Да, это правда. Я только что не дошёл до покупки непосредственно пятой апельсины, а сначала тупо позапускал их через олламу на ноуте. Туповатые, кривоватые. Думаю, единственный смысл(кроме того факта что «настоящая нейронка дома») — это от скуки доковыряться с промптом а-ля «представь, что ты жираф, как бы ты залезал на ёлку?». И послушать как оно бредит.
И раз уж зашла речь — забавный факт. Стимдек неплохо крутит нейронки, народ поднимал на нём модели вплоть до 14b
+
avatar
0
  • FloX
  • 20 ноября 2025, 05:38
у меня все нейронки дома это immich, где прямо очень хорошо, и описание фото из frigate.
+
avatar
+3
  • Kheamu
  • 19 ноября 2025, 12:45
Панель за 2400р, динамик подключается, прошивка для HA есть. Плюсом 3 реле физических. Корпус печатается на 3д принтере(на фото задняя панель с реле снята, корпус тоже отложен в сторону).
Работает с сервером на N100.
А ИИ — очень спорно. Мне он в медицинских вопросах и в вопросах электроники так безбожно врёт, что зарёкся его использовать.
+
avatar
0
можно подробнее? что за панель, ссылка на интеграцию с НА? сейчас играюсь с nspanel — хочу ее приколхозить к уд
+
avatar
+2
  • Kheamu
  • 19 ноября 2025, 16:25
Всё здесь — от интеграции, до ссылок на Али.
Делал всё по этому мануалу — обязательно прочитайте все комментарии после поста.
+
avatar
0
  • 00svd00
  • 19 ноября 2025, 16:34
Но ведь там же нет микрофона. Это ж совсем для другого
+
avatar
0
так никто и не спорит что для другого — микрофоны у меня на алисе, а такое хочу прикрутить на площадке 2 этажа погоду показывать и пару лампочек во дворе включать. не, можно конечно алису спросить, но домашние могут спать в это время, да и бросить взгляд проходя мимо будет явно проще…
+
avatar
0
  • 00svd00
  • 19 ноября 2025, 22:30
Дак я ж не говорю что оно не нужно. Я думал что за те же деньги можно взять почти тоже самое, но с экраном втрое больше)
ИМХО если есть конкретный список ламп — лучге собрать клавесин на физических кнопках. Сенсорное управление в реальной жизни — зло.
+
avatar
0
  • FloX
  • 20 ноября 2025, 05:46
проще старый планшет с отдельным дашбордом из ХА
и если планшет не совсем старый, то и Сири тоже будет.
+
avatar
+1
  • maxik
  • 19 ноября 2025, 14:59
Блин, без паранойи, но лучше я китайцам солью все разговоры в моей квартире…
+
avatar
0
  • urus
  • 19 ноября 2025, 12:14
А можно ли Марусю прошить на НА?
+
avatar
+1
  • 00svd00
  • 19 ноября 2025, 12:36
В смысле голос? Или что вы подразумеваете под прошить?
Колонку их перешить? Если на гитхабе нет готового — скорее всего нет. Колонки для HA довольно тупые на самом деле, по сути там крутится micro wake word на ЕСПшке, и когда он тригеррится — колонка становится тупой трубой в HA и обратно.
+
avatar
0
  • Kheamu
  • 19 ноября 2025, 12:50
Насколько тупой она будет — зависит от Вас. Любой запрос голосовой можно прописать отдельно (стандаотные таймеры и включи\выключи не беру в расчёт).
+
avatar
+2
  • 00svd00
  • 19 ноября 2025, 12:58
Можно. Имелось в виду, что на самом устройстве никакой логики не крутится(кроме той, что базово реализует работу с аппаратной частью). Всё на стороне сервера.
+
avatar
0
  • Lvenok
  • 20 ноября 2025, 00:57
Распознавание голосовых команд на ком лежит?
+
avatar
+1
  • 00svd00
  • 20 ноября 2025, 01:25
Слово-активатор распознается на самой колонке(моделью micro wake word), помле чего колонка начинает гнать аудиопоток на сервер, где он переводится в текст STT движком(Whisper или VOSK например), после чего внутри HA распарсивается на команды(или не распарсивается — если ничего не подошло).
+
avatar
0
  • urf
  • 19 ноября 2025, 12:45
тоже волнует вопрос, а то валяется. На работе когда то подарили на запуске.
+
avatar
+6
  • aliex
  • 19 ноября 2025, 12:16
Мда, судя по описанию — за такое должны приплачивать.
+
avatar
+2
  • 00svd00
  • 19 ноября 2025, 12:35
Да не, нормально. На самом деле косяки минорные, видал я киты и хреновей.
+
avatar
+1
  • aliex
  • 19 ноября 2025, 13:41
Не, понятно, что может быть хуже, но… Где микрофонные массивы, где суровые DSP для борьбы с шумом, где хорошая акустика?

Я, пожалуй, задолбался от отношения к опенсорсу в виде «ну как-то работает». В хорошем варианте он работает много лучше, чем закрытые решения.
+
avatar
+3
  • 00svd00
  • 19 ноября 2025, 13:46
где суровые DSP для борьбы с шумом, где хорошая акустика
В Voice PE и самопалах на базе ReSpeaker Lite)
Первый очень хорош, но за него люди внезапно хотят хороших денег.
Второй несколько дешевле, но надо ещё собрать достойную железку. У меня получилось средне, оно работает, но явно могло работать лучше.
А этот кит удачен тем, что сносно работает, недорого стоит и представляет собой решение почти под ключ. Действительно сносно — в сравнении с M5 Echo Atom им действительно можно пользоваться и не плеваться.
+
avatar
0
  • aliex
  • 19 ноября 2025, 14:03
Всего два микрофона. А в «фирменных» колонках их вряд ли просто для интереса побольше ставят.

Что характерно, заметных денег там только хороший динамик будет стоить, и то не факт. Вот софт (для DSP того же) — это да, это сложно, но к стоимости кита уже отношения не имеет.
+
avatar
+1
  • 00svd00
  • 19 ноября 2025, 14:16
А в «фирменных» колонках их вряд ли просто для интереса побольше ставят
Чёрт их знает. Даже с двумя микрофонами эти железки работают прям очень хорошо. Так что зачем ставят больше — вопрос. Возможно забивают железом то, что не смогли решить программно.
хороший динамик будет стоить
Ну кстати нифига, есть бюджетные вполне достойные модели. Я для самопальной колонки вот такие взял
https://aliexpress.ru/item/32716065547.html
В первую очередь потому что беленькие, но звук вполне достойный. 650р за два штука.
И от этих же AIYIMA брал ранее динамики для самопального сабвуфера(если что — вот этот проект с фигневёрса www.thingiverse.com/thing:4765663) — тоже отлично звучит.
+
avatar
0
  • FloX
  • 19 ноября 2025, 12:38
поглядываю на такое время от времени и продолжаю пользоваться Сири
HomeKit из ХА.
+
avatar
+3
  • 00svd00
  • 19 ноября 2025, 12:40
За вычетом функционала LLM(которого нет за отсуствием самой ллмки) всё на самом деле работает довольно неплохо. VOSK с ограничением словаря распознаёт голосовой ввод очень стабильно. Включать-выключать свет, открывать шторы, открывать домофон, всякое такое — оно прекрасно справляется. А большего мне по сути и не надо, поговорить я с женой могу)
+
avatar
+1
  • FloX
  • 19 ноября 2025, 13:03
ну я от Сири большего и не прошу. удобно что она есть и в часах и в телефоне и в колонке
ну и бонусом колонка прям хорошая колонка
но не исключаю все таки приобретения такого на пробу
+
avatar
0
  • Kheamu
  • 19 ноября 2025, 13:08
Это всё здорово. Меня больше волнует вопрос автономности в свете последних событий с блокировками\отключениями интернета и тд. Вопрос — как скоро доберутся до Сири.
+
avatar
0
  • 00svd00
  • 19 ноября 2025, 13:09
Не знаю как в айфонах, но под андроидом HA можно подключить в качестве дефолтного голосового помощника. Правда не знаю зачем — по всему дому и так колонки раскиданы)
+
avatar
0
  • Kheamu
  • 19 ноября 2025, 13:10
Опять же — надеюсь, вы не об облаке.
+
avatar
0
  • 00svd00
  • 19 ноября 2025, 13:14
Нет, функция ассистента реализуется их же фирменным приложением, которое смотрит на локальную инсталляцию HA
+
avatar
0
  • FloX
  • 19 ноября 2025, 13:03
del
+
avatar
0
  • pmaks
  • 19 ноября 2025, 13:33
Нда. Китайцы конечно продумывать не хотят. Засунуть микрофон внутрь и не сделать в корпусе отверстия для доступа звука к нему.
Автор, не думал отверстие напротив микрофона сделать в корпусе и закрыть его звукопроницаемой тканью? Как интересно по распознаваемости изменится? Может сравнится с Voice PE??
+
avatar
0
  • 00svd00
  • 19 ноября 2025, 13:38
Отверстие в корпусе есть
У Voice PE, в отличии от этой железки, на борту сборка из двух микрофонов с шумоподавлением и корпус, разработанный инженерами, которые что-то понимают в звуке. Как результат — очень и очень хорошая работа, не сравнимая ни с вот такими китами, ни с самопалами.
+
avatar
+1
  • rustamt
  • 19 ноября 2025, 13:51
сборка из двух микрофонов
Все равно как-то не очень выглядит по сравнению со всякими amazon echo у которых 4-6 микрофонов :)
+
avatar
+4
  • 00svd00
  • 19 ноября 2025, 14:12
Куда столько то?) Или типа как с камерами в современных телефонах, если меньше трёх — значит барахло, а не аппарат?))
Даже если там как у Respeaker lite есть микрофон с алгоритмом, оптимизированным под mikro wake word и отдельный, оптимизированный под распознавание речи. И пускай ещё один направлен в другую сторону, чтобы вычитать фоновый шум — зачем ещё три то? Не, им виднее конечно.
+
avatar
0
  • rustamt
  • 19 ноября 2025, 14:18
ну оно музыку умеет играть, например, и при этом должно различать что ему крикнули из соседней комнаты )
+
avatar
+1
  • 00svd00
  • 19 ноября 2025, 14:30
Опять же — Voice PE это умеет всего с двумя микрофонами. По крайней мере при воспроизведении родным динамиком. Как — не знаю, магия наверное)
+
avatar
+5
Как я понимаю, там аналог фазированной антенной решётки, только для звука. Т.е. даже если в помещении одновременно говорит несколько человек и играет музыка, то алгоритмами можно весьма точно выделить в отдельности речь каждого человека и фоновый шум
Upd
Нашёл статью для ознакомления: habr.com/ru/articles/431144/
+
avatar
+1
  • 00svd00
  • 19 ноября 2025, 14:54
Любопытно. Если я правильно понимаю — для такой схемы «рупор» не нужен и даже вредит. Возможно поэтому у моей сапопальной колонки чувствительность получила ь средняя, я вокруг микрофонных дырок сделал глубокие фаски. Надо попробовать перепечатать корпус без них
+
avatar
0
  • Zolg
  • 19 ноября 2025, 20:45
Для такой схемы в первую очередь (кроме самих микрофонов, ессно) нужны алгоритмы и калибровка их параметров под конкретное устройство. Сомневаюсь, что в HA voice assistant оно есть.
+
avatar
-6
  • vovans
  • 19 ноября 2025, 15:26
+
avatar
+1
  • 00svd00
  • 19 ноября 2025, 15:34
Как же тошнит от этих няшных узкоглазых грудасиых девиц.
На вкус и цвет. Аккуратная, вручную отрисованная анимация — выглядит куда приятнее выбросов нейронок. Но вас никто не принуждает — в репке куча разных оформлений, а при особо сильном желании можно отрисовать самостоятельно.
удобнее и быстрее сделать это руками
При условии, что руки чистые и свободны. И телефон в кармане, а не в соседней комнате.
+
avatar
+5
  • maxik
  • 19 ноября 2025, 15:50
это должно заканчиваться словами «как же я вас всех ненавижуууууу» :)))
+
avatar
0
  • Lvenok
  • 20 ноября 2025, 01:01
Надо еще дойти до выключателя ))
+
avatar
0
  • FloX
  • 20 ноября 2025, 06:05
это если у вас однушка-двушка
а если несколько этажей и в саду свет, то уже все выглядит по другому
+
avatar
-1
Это всё очень интересно, конечно, но за 2700 три дня назад купил яндекс лайт 2, в дополнение к рабочей лошадке яндекс миди. Не, понятно, что это облако, подписка и всё такое, но… Если пропадет интернет, то умный дом — это последнее, что будет меня беспокоить. Home assistant вне дома тоже будет недоступен. А другая сторона медали — это превосходное качество распознавания речи, мгновенная(ну хорошо, очень быстрая) отработка команд, много плюшек разных с интеграциями Yandex station и Yandex intent. Будем надеяться, что рано или поздно ассист дотянут до такого качества.
+
avatar
0
Увы, превосходное качество распознавания и мгновенная отработка команд во-многих случаях сводится на нет слабоумием Алисы. Сейчас она включает телевизоры и переключает каналы, а через через мгновение на тех же четких фразах скажет, что такого не умеет. И наоборот. Я уже привык к этому, конечно.
Использую ее также в разных тандемах с HA.
Ну а тупость ответов на обычные вопросу по-моему с каждым днем все увеличивается. Ощущение, что это делается искусственно. Не знаю, наверное у других голосовых ассистентов еще хуже, но все же они за это деньги хотят немалые (хорошо хоть промокоды выручают от бессмысленных трат). Если бы хотя бы здесь было все на сколь-нибудь хорошем уровне, то уже было бы круто.
А так чем больше я ее использую, тем больше разочаровываюсь в ее функционале.
+
avatar
0
Мне лично за почти три года пока только однажды случилось встретится с «я не нашла устройства...». Вылечилось перезагрузкой НА. Ну и я.дмалоги подглючивают иногда, но это тожев большинстве случаев проблемы на моей(с ркн) стороне. А так, да, подписку с баллами мвидео «нащелкал» до конца 29 года по тыще в год, а дальше, как в той поговорке — либо шах, либо осел. Контента всё меньше. Их якниги пока «тащат», лично для меня. Да и то, потому что их сервисы в белый список включены.
+
avatar
0
  • 00svd00
  • 19 ноября 2025, 22:27
Так и тут прекрасно распознаётся речь и команды исполняются может не мгновенно, но очень быстро. Большая часть задержки идёт от подтупливающего иногда зигби.
+
avatar
0
Ну там у вас в одном из видео от «включи свет» до исполнения команды прошло? Секунд 7-8? Это прям беда! Я нервничаю, если у меня где-то случается задержка в секунду. Но тут подозреваю, что вопросы больше к быстродействию самого сервера ХА.
+
avatar
0
  • 00svd00
  • 20 ноября 2025, 07:11
Неа, говорю же, это проблема с сетевой доступностью оконечных устройств. Когда в какой-то зоне получается больше одной железки, оно их последовательно перебирает. И если какая-то из железок тупит — то получается такая вот ерунда. Конкретно тут плохо добивает до релюшки, включающей свет над столом. В спальне, где приём уверенный, аналогичная команда проходит за секунду, максимум за две.
Реальная скорость отработки команд без задержек от сетевых приколов видна на запросе погоды.
З.Ы. Ну и ещё конечно аот эта схема, когда мы сначала откидываем сообщение на MQTT, ждём, пока его подберёт Z2M, дёрнет оконечную железку, дождётся обновления статуса, положит от об этом сообщение на MQTT, вычитываем это сообщение… Почему это сиало де факто стандартом для меня натурально необъяснимо. Кондеи например у меня управляются через еспшки с самописной прошивкой топо через rest api — и там задержек не бывает вообще никогда.
+
avatar
0
  • DMA
  • 19 ноября 2025, 22:03
Не лучше ли реализовать через wakeword на старом андроид планшете/телефоне? Или приложуха HA такого «не умеет» из коробки, ибо свои железки как-то надо-же продавать?
+
avatar
0
  • 00svd00
  • 19 ноября 2025, 22:26
Умеет, но ЕМНИП через Ok Google.
Может и можно, но мне не нравится вариант с прикручиванием к стене старых телефонов, это просто неаккуратно.
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.