А вы не думали, что ограниченный выбор активационных фраз у Яндекс.Станции основан на том, что колонка должна вас услышать и понять, что вы обращаетесь к ней, ТОЛЬКО за счет собственного железа, без обращения к серверам и всяким там нейросетям? Вычленить "алису" или "яндекс" из шума только своими силами.
Причем всё это с учетом того, что редко кто говорит - "Алиса"...паузачтобыуспетьраспознать..."включи свет". Говорят обычно слитно - "Алиса, включи свет". И колонка успевает понять что зовут её, соответственно, записывает слова после "алиса", распознает их уже через сервер, понимает что от неё хотят и включает свет. "Ок Гугл" и "Привет Сири" требуют паузы (пилип-пилик), чтобы устройство связалось с сервером :) А Алиса паузы не требует. Как и обучения голосу, а среагирует на "Алису", кто бы её не звал.
И вот это локальное распознавание и является тем камнем преткновения, который ограничивает возможный выбор. Программисты учат железо на сотнях тысяч голосовых паттернов, предсказания, отсев шумов, вот это всё. Очень непросто. Была по этому поводу большая статья на Хабре, в которой, как раз и рассказывалось, почему только Алиса и Яндекс.