Cofounder_logo_white

*

*

Забыли пароль? | Регистрация
Cofounder.ru — поиск партнеров для создания стартапов.
Другими словами — дэйтинг сервис для стартаперов.
Еще здесь можно обсуждать идеи и общаться

Вы не авторизованы. Нет аккаунта? Создайте его прямо сейчас.

Идеи / Распознавание речи

Сейчас занимаюсь алгоритмами распознавания речи. Есть понимание того, почему у других не получилось распознать речь - спектральный анализ по Фурье крайне неустойчив при шумах. Сейчас аккуратно обхожу недостатки рядов Фурье и думаю, что добьюсь расознавания. Интересно было бы пообщаться с людьми, также занимающихся распознаванием речи.

Ищу: Разработчика, Инвестора, Дизайнера, Менеджера, Команду
Автор: sabirman
Добавлено: 10 сент., 17:03



← назад

Hamburger[1] vit1251 29 нояб., 03:08
Просто интересно наблюдать за проектом. Если у вас есть SVN, то было бы любопытно взглянуть на ваши попытки обойти недостатки рядов Фурье!
Emote_smile_thumb sabirman 30 нояб., 12:49
Сейчас проект в стадии сбора материала. Записывается речь на микрофон, производится простейшая фильтрация и анализируются различия в звуках
A_808a81be webman 30 нояб., 21:20
офигенная идея=) я бы тоже с удовольствием понаблюдал
а Вейвлет анализ вам не пригодиться?
Emote_smile_thumb sabirman 30 нояб., 22:01
вейвлет преобразования - конечно пригодится, завтра в ЖЖ выложу, как примерно выглядят звуки
A_808a81be webman 30 нояб., 22:01
есть гталк, icq?
Emote_smile_thumb sabirman 01 дек., 21:35
Аська есть: 298826739, но удобней общаться по почте: sabirman@mail.ru.
Emote_smile_thumb sabirman 01 дек., 21:35
Выложил примеры графиков звуков с комментарием
http://sabirman.livejournal.com/
Emote_smile_thumb valairus 30 дек., 23:03
http://www.yugzone.ru/raeding_wrods.htm
визуальное и слуховое восприятие информации довольно схоже и зачастую зависимы друг от друга, почитайте статью, если будут вопросы - пишите. Я по образованию молекулярный биолог, но занимаюсь IT.
A_808a81be webman 05 февр., 14:38
как у вас продвигается дело?? можете скинуть литературу?
Emote_smile_thumb sabirman 08 марта, 09:38
Дела - что-то я застрял. Когда-то занимался сопоставлением стереоизобразений - вроде задача сложнее, но там можно было представить визуально. А при расознавании звуков идёт сплошной шум и "на глазок" ничего не видно. Ясно что, Фурье работать впринципе не может, но мои алгоритмы тоже нарываются на шум. При сопоставлении сетеопар был 30-ти кратный шум, т.е. из 60 000 преполагаемых сопоставлений нужно "срезонировать" до 2000. Похоже в распознавании звуков уровень ложных соответвий выше ещё на порядок.
Adamska-ocelot-tux-2439 masterflomaster 30 июня, 07:56
Может не самый лучший совет, но я рекомендую вам приглядеться к http://codeunity.ru
Чтобы оставлять комментарии вы должны авторизоваться. Нет аккаунта? Создайте его прямо сейчас.