Готовый перевод Military Technology / Военная техника: Глава 69 Голосовая температура

У Хао с улыбкой покачал головой и сказал: «Нет, это просто незавершенный продукт. Есть еще много проблем, которые нужно решить.

Например, в диалоге сейчас труднее понять и справиться с нечеткими контекстами. "

"Неясный контекст?"

Цзоу Сяодун на мгновение ошеломился и вскоре понял: «Кажется, нам трудно это понять, не говоря уже о машинной программе.

Босс, я не совсем понимаю. Распознавание речи и речевой диалог в настоящее время осуществляется большинством технологических компаний, и результаты хорошие.

Степень распознавания этих речевых программ для нашей обычной речи также очень высока, которая в основном может достигать более 99%.

Но скорость отклика этих программ намного меньше, чем у нашей технологии. Способность разбираться не так сильна, а вычислительная мощность Леново не сравнима.

Кроме того, с точки зрения голосового диалога, как вы это делаете, чтобы язык машины был настолько близок к голосу реального человека.

Нам нужно знать, что человеческий слух по-прежнему очень чувствителен, и можно быстро различить, человеческий это звук или звук машинной программы. "

У Хао услышал много вопросов от Цзоу Сяодуна и спросил его: «Как вы думаете, в чем самая большая разница между настоящим голосом и голосом ИИ?»

Цзоу Сяодун на мгновение задумался, а затем ответил: «Не хватает ли покоя?»

Ву Хао покачал головой и сказал: «Это не самое критичное. Фактически, некоторые голосовые программы на рынке уже могут просто успокоиться».

"То есть……"

У Хао посмотрел на необъяснимый взгляд Цзоу Сяодуна и с улыбкой сказал: «Эмоции, все голосовые программы на рынке теперь не имеют эмоций».

«Эмоции, что это за шутка, как в программе могут быть эмоции, это талант». Цзоу Сяодун покачал головой и не мог понять.

У Хао улыбнулся, а затем заставил компьютер отобразить структурную схему на большом экране и сказал: «Дело не в языке, а в эмоциях.

Когда мы говорим, другая сторона может четко ощущать эмоциональные изменения, когда мы говорим. Это эмоция, а также температура языка.

Более того, языковая программа реагирует по фиксированной формуле. Поэтому он не может понять температуру каждого предложения, естественно, нет температуры при генерации речи.

Что нам нужно сделать, так это добавить понимание словарной среды языка в процесс распознавания стереотипов речи, а также анализировать температуру дискурса и эмоциональные изменения говорящего от разных тонов. "

«Я до сих пор не могу понять, как меняются эмоции людей, когда они говорят, и как программа может их уловить. Вы должны знать, что иногда небольшие изменения в языке и тоне могут показывать два совершенно разных значения и две эмоции. Как машина может сказать. «Цзоу Сяодун выразил сомнения.

У Хао улыбнулся, демонстрируя контент на экране, и ответил ему: «Это использование технологии ИИ. Язык у всех разный, и выражение эмоций тоже постоянно меняется. Если мы используем традиционный метод, нам нужно чтобы изменить их Возьмите, соберите, проанализируйте и определите интонационный контекст языка.В этом случае рабочая нагрузка может быть слишком большой.

Таким образом, способность технологии ИИ к обучению и развитию позволила мне найти идеи. Мы можем обучить набор основных голосовых программ искусственного интеллекта, собирая информацию о любимом голосе в Интернете.

Конечно, это всего лишь пример базовой программы, нам нужно внести соответствующие коррективы в соответствии с привычками пользователей. Пусть программа учится подстраиваться под пользователя, чем дольше пользователь ее использует, тем точнее распознавание и понимание программы распознавания ИИ. "

Говоря об этом, У Хао рассмеялся: «На самом деле это очень похоже на то, как мы живем в реальном обществе. После того, как два незнакомца поладят, обе стороны постепенно поймут, как приспособиться друг к другу.

Чем дольше время, тем более знакомыми будут две стороны. Даже одна сторона может точно воспринять и понять простое слово, жест или взгляд. Это называется молчаливым пониманием.

Что нам нужно сделать, так это культивировать молчаливое понимание процедур и людей, но пользователя трудно изменить, и он может оказывать лишь тонкое влияние. Итак, мы должны начать с программного обеспечения, позволить ему адаптироваться к пользователю и неявно изменить пользователя.

Только так взаимодействие человека с компьютером будет более неявным.

Это также является причиной того, что я не мог понять свой двусмысленный контекст, когда разговаривал с 10. Он не адаптировался к моим разговорным привычкам, поэтому не понимал, что означают двусмысленные слова, которые я произносил.

Что, сколько, сколько, так, где, случайные, эти неопределенные и двусмысленные слова, программе трудно понять и разобраться. А это требует от нас дать основное определение этим словам. Это определение не может быть жестким и жестким, но также должно модифицироваться в соответствии с контекстом пользователя. "

Сказав это, У Хао посмотрел на Цзоу Сяодуна и положительно сказал: «Только после того, как программа поймет эмоциональную температуру наших реальных слов, она сможет имитировать голос, похожий на речь реального человека».

«В любом случае, это крупный прорыв в области голосовых технологий ИИ. Я думаю, что эта технология определенно потрясет мир после того, как будет выпущена, но она представляет собой настоящее наступление этой эры интеллектуального голоса ~ www.mtlnovel.com ~ Быть Честно говоря, я не могу больше ждать, — Цзоу Сяодун облизнул пересохшие губы и взволнованно сказал.

У Хао махнул рукой и сказал: «Это не так преувеличено, как вы сказали, но это действительно большой прорыв в технологии».

«Босс, вы намерены использовать эту технологию непосредственно для массового потребительского рынка, или вы сотрудничаете с корпоративными пользователями, продаете технологии и связанные с ними патенты или предоставляете им услуги с расслаблением открытого исходного кода?» Цзоу Сяодун удивился. Это тяжеловесная технология, с кем бы вы ни работали, она вызовет огромный шок в отрасли.

"Что вы думаете?" У Хао не ответил прямо, но переспросил.

Цзоу Сяодун подумал об этом, а затем серьезно сказал У Хао: «Компания, которая хочет стать больше и сильнее, не может ограничиваться одной сферой. Сотрудничество с предприятиями может спасти многое, но риски велики. передовые технологии, мы сталкиваемся с риском быть заброшенными.

Поэтому я думаю, что мы должны развивать массовый рынок, использовать эту технологию для создания нашего бренда среди людей и расширения нашего влияния. Только так мы сможем уменьшить ненужные хлопоты и сопротивление в будущем развитии. "

«Анализ есть, но у рынка огромный потенциал. Одной монополии явно недостаточно. Нам еще нужно сотрудничать с этими компаниями. Конечно, мы не можем отставать на массовом рынке.

Так что я собираюсь сделать и то, и другое, и этот умный голосовой помощник создан для массового рынка. Как насчет того, чтобы выложить видео, которое я только что показал, как вы думаете, какая будет реакция в обществе и индустрии. — с улыбкой спросил У Хао.

«Ты имеешь в виду… ха-ха, я с нетерпением жду этого!»

http://tl.rulate.ru/book/65881/2129229

Обсуждение главы:

Еще никто не написал комментариев...
Чтобы оставлять комментарии Войдите или Зарегистрируйтесь