{"id":2175,"url":"\/distributions\/2175\/click?bit=1&hash=803b6e1bcbd9dfc4ba9456fda887a878c80d24df8d3a575913b14876e18923a5","title":"TJ \u0437\u0430\u043a\u0440\u043e\u0435\u0442\u0441\u044f 10 \u0441\u0435\u043d\u0442\u044f\u0431\u0440\u044f \u2014\u00a0\u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0439\u0442\u0435 \u0430\u043d\u043e\u043d\u0441 \u0441 \u0434\u0435\u0442\u0430\u043b\u044f\u043c\u0438","buttonText":"\u0427\u0438\u0442\u0430\u0442\u044c","imageUuid":"d1d355d8-93a3-5140-aeae-14b03046b760","isPaidAndBannersEnabled":false}

Разработчик создал бота для «ВКонтакте», распознающего голосовую речь Статьи редакции

Разработчик Максим Лепеха запустил бота, который распознаёт голосовую речь в личных сообщениях во «ВКонтакте». По словам автора, программа может без проблем различать короткие фразы из нескольких слов.

Максим Лепеха

В основе программы стоит алгоритм SpeechKit Cloud от компании «Яндекс», который позволяет распознавать речь и используется в «Яндекс.Навигаторе». Бот трансформирует слова, сказанные в микрофон, в текстовое сообщение и отправляет автору.

В разговоре с TJ Максим рассказал, что запустил бота утром 15 декабря, и за сутки он обработал около 400 сообщений от 200 человек.

Идея создания бота возникла с популяризацией голосовых сообщений «ВКонтакте». Не знаю почему, но мне они не понравились изначально — не всегда бывает подходящая ситуация, чтобы было возможно послушать аудио: то ты едешь в метро, то стоишь с друзьями.

А потом прочитал об аналогичном боте в Telegram. Поискал — ничего похожего не нашел. Ну и за пару часов написал первую версию. Тестировали в час ночи с друзьями, к утру было готово минимальное оформление группы и анонс.

Максим Лепеха, создатель бота

Пока программа с трудом справляется с длинными предложениями, но правильно распознаёт короткие фразы длиной до шести слов. Например, предложения «А с мобильного устройства можешь распознать?» и «Попробуй ещё раз, я говорю прямо в микрофон» бот распознаёт неполностью.

По словам создателя, проблема заключается в алгоритме «Яндекса», на сервера которого отправляются сообщения для распознавания. Компания также устанавливает ограничение на количество запросов — не более тысячи штук в сутки.

В ближайших планах — договориться с «Яндексом» о том, чтобы мне увеличили лимит распознаваний голосовых сообщений в сутки и поработать над точностью. Потому что она сейчас оставляет желать лучшего — как полностью рабочий инструмент данного бота сложно использовать.

Максим Лепеха, создатель бота

30 ноября разработчики «ВКонтакте» запустили бота, который отвечает на сообщения пользователей видеороликами с фразами ведущего Сергея Дружко. Алгоритм работает на основе векторов — массивных чисел, передающих семантический смысл слов.

0
26 комментариев
Написать комментарий...
Подробный Паша

Вы только вдумайтесь! Добавили функцию "голосовых сообщений", а теперь общество ищет пути переводить их обратно в текст. Это и есть безумие! Автору + за идею, но:

В ближайших планах — договориться с «Яндексом» о том, чтобы мне увеличили лимит распознаваний голосовых сообщений в сутки и поработать над точностью. Потому что она сейчас оставляет желать лучшего — как полностью рабочий инструмент данного бота сложно использовать.

Скорее всего ответ будет "нет", иначе было бы глупо. Если скажут да, каждый школьник будет просить.

и поработать над точностью

Автор считает, что это от него зависит точность распознавания? Алгоритм же "Яндекса". Или он решил просить "Яндекс" увеличить точность?

Ответить
Развернуть ветку
Вечный рубин

Ответ может быть и положительный за определенное вознаграждение, как премиум.

Ответить
Развернуть ветку
Технологический танк88

Вполне могут согласиться если он наберет популярность, Я так понимаю он присылает распознанный текст в виде сообщения. А в добавок будет присылать рекламу Яндекса или его софта. Вот и будет договор у них. Ему бесплатно сервис, который Яндекс вообще не нагрузит никак, а Яндексу реклама повсюду куда доабвят этого бота.

Ответить
Развернуть ветку
Подробный Паша

Есть ещё один минус.

Ответить
Развернуть ветку
Прозрачный чувак

потестируй аську

Ответить
Развернуть ветку
Изящный мангал

Лепёха 😏

Ответить
Развернуть ветку
Классный Никита

инфоповод огонь :|

Ответить
Развернуть ветку
Северный фонарь

Это же пипец. Новизны на самом деле ноль: прикрутить яндекс speech kit к боту. Мы в своих ботах telegram уже пол года назад такое делали, правда постеснялись где-то релизить - осталось как пасхалка.

А тут целая статья на tj.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Принудительный браслет

Отправить текст-то не проблема, он пишет, что нет возможности прослушать входящее аудиосообщение в перечисленных ситуациях

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Прозрачный чувак

Эта фича уже штатно есть в ICQ, любое входящее или исходящее сообщение можно перевести в текст. Запустили в начале года. И технология вполне доступная, работает на большом количестве языков и распознает длинные фразы.

Ответить
Развернуть ветку
Прозрачный чувак

кстати реализована фича на базе распознавания фирмы Nuance (те ребята, которые поучаствовали в создании Siri)

Ответить
Развернуть ветку
Откровенный Данила

Эм, как бы так намекнуть, тут уже 2017 скоро.

Ответить
Развернуть ветку
Прозрачный чувак

да да да, шутки про возраст. ОК. Только там сейчас технический уровень и фичи именно 2017 год.

Ответить
Развернуть ветку
Откровенный Данила

Осталось пользователей добавить, и будет норм.

Ответить
Развернуть ветку
Технологический танк88

А не проще просто на клаве юзать ввод текста голосом. Зачем именно аудиофайл отсылать то.

Ответить
Развернуть ветку
Прозрачный чувак

так это другая функция же. Кто-то отправил аудиофайл, а тебе не вариант его послушать, и тут можно перевести его в текст.

Ответить
Развернуть ветку
Технологический танк88

Так в том то и дело зачем сразу отправлять аудиофайл если его неудобно слушать когда можно надиктовать текст.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Предвыборный теркин30см

Ну на айфоне иногда голосовой ввод использую, когда аудио не хочу писать) Вполне себе

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Подробный Паша

Наверное сложно жить с именем "Х" и номером +7 ZZZ ZZZ-ZZ-ZZ.

Ответить
Развернуть ветку
Изящный мангал

Норм

Ответить
Развернуть ветку
Школьный Влад
По словам создателя, проблема заключается в алгоритме «Яндекса», на сервера которого отправляются сообщения для распознавания. Компания также устанавливает ограничение на количество запросов — не более тысячи штук в сутки.

Это ограничение для бесплатного использования.

Ответить
Развернуть ветку
Бесконечный файл

Комментарий недоступен

Ответить
Развернуть ветку
Лишенный огонь

Скороговорки вполне хорошо распознаёт)

Ответить
Развернуть ветку
Внезапный глобус

В вк теперь можно делать нормальных ботов с вебхуками?

Ответить
Развернуть ветку
Плоский химик

Да, через сообщества

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Компьютерный Абдужаббор

Нахуя?!

Ответить
Развернуть ветку
Читать все 26 комментариев
null