به زودی تشخیص صدای انسان و هوش مصنوعی دشوار خواهد شد

**Sina homaei** · 2018/05/01, 20:19

شرکت DeepMind بریتانیا با استفاده از فناوری هوش مصنوعی خود یک سیستم گفتگو تلفیقی به نام WaveNet را سال ۲۰۱۶ معرفی کرد. این سیستم بر مبنی یک شبکه عصبی مصنوعی عمل کرده که قادر است نمونه گفتاری با وضوح بهتر از نمونه‌های مشابه ارائه دهد.
محسن راعی - پایگاه خبری مدیریت شهری کرج: شرکت DeepMind بریتانیا با استفاده از فناوری هوش مصنوعی خود یک سیستم گفتگو تلفیقی به نام WaveNet را سال ۲۰۱۶ معرفی کرد. این سیستم بر مبنی یک شبکه عصبی مصنوعی عمل کرده که قادر است نمونه گفتاری با وضوح بهتر از نمونه‌های مشابه ارائه دهد.

به کمک چنین سیستمی صدا هوش مصنوعی به صدا انسان بسیار نزدیک‌تر است. WaveNet از این رو توسعه یافته تا گوگل اسیستنت روی سیستم عامل‌های مختلف بازدهی قابل توجهی داشته باشد. در حال حاضر WaveNet با صدا انسان گونه خود حتی بهبودی پیدا کرده و صدای نزدیک‌تر به یک انسان دارد.

این سیستم در ژانویه سال ۲۰۱۸ توسط گوگل راه اندازی می‌شود و سیستم قادر است به همکاری با سیستم متن به گفتار Tacotron 2 بپردازد. در ابتدا Tacotron 2 متن را به شکل نمایش بصری از طریق فرکانس‌های صوتی در طی مدت زمانی ترجمه می‌کند که به عنوان طیف سنجی محسوب می‌شود. سپس WaveNet به خواندن طیف سنجی پرداخته و یک نموداری با عناصر صوتی مربوطه ایجاد خواهد کرد.

براساس این مطالعه، امتیاز مدل به شکل متوسط ۴٫۵۳ بوده که برای سخنرانی‌های حرفه‌ای برابر است با ۴٫۵۸٫ به عبارتی ساده این نوع سخنرانی شباهت نزدیکی به سخنرانی ساده دارد.

در حقیقت گوگل صدا ضبط شده و AI خود را در کنار باقی قرار می‌دهد و معلوم است که دستگاه همانند یک شخص است.

سیستم سخنرانی SYNTHETIC

امروز سیستم‌های مبتنی بر هوش مصنوعی بهبودی پیدا کرده و موجب نزدیک شدن عملکرد آنها به انسان شدند. اگرچه هوش مصنوعی قادر نیست عملکردی دقیقا مشابه انسان داشته باشد اما می‌تواند نزدیک عمل کند. دیگر هوش مصنوعی می‌تواند به ایجاد ویدئوهای جعلی بپردازد و همچنین نمی‌توان حضور پر رنگ هوش مصنوعی در کنار انسان را نادیده گرفت.

تقلید کردن صدای انسانی همیشه چالشی برای هوش‌های مصنوعی بود. در حال حاضر دو سیستم WaveNet و Tacotron 2 شرکت DeepMind در حال تغییراتی هستند و موجب نزدیک شدن به عملکرد انسان می‌باشند. نه تنها این نوع هوش‌های مصنوعی می‌توانند تلفط نزدیکی داشته باشند، بلکه قادرند در آینده تلفظ کلمات و جملات را به سادگی انجام دهند. در حال حاضر تنها لغات مشخصی تلفظ می‌شود اما در آینده این امر گسترده‌تر خواهد شد.

البته نباید پنداشت سیستم جدید AI کامل است و نقصی ندارد. تکرار صدا آن تنها براساس سیستم آموزش داده شده بوده که گوگل برای آن زنی را استخدام کرد تا صدا را به ثبت برساند. برای Tacotron 2و WaveNet نیز یک زن و مردی نیاز بوده و به کار گرفته شد.

گذشته از گوگل اسیستنت که به عنوان یک دستیار فوری شناخته می‌شود، گوگل در تلاش است Tacotron 2 و امثال آن را نیز بزودی به کار گیرد تا سیستم AI مختلفی را به مشتریان خود ارائه دهد.
به زودی تشخیص صدای انسان و هوش مصنوعی دشوار خواهد شد

**Sina homaei** · 2018/05/01, 20:19

نزدیک‌تر شدن صدای رایانه و ربات به صدای انسان

شرکت "دیپ‌مایند" با بهره‌گیری از شبکه‌های عصبی برای ساخت گفتار، سرانجام توانسته صدای رایانه‌ها (و ربات‌ها) را انسانی‌تر (به صدای انسان نزدیک‌تر) کند.
��چهره‌ی ربات، ��صدای فرشته!��

چکیده:
شرکت "دیپ‌مایند" با بهره‌گیری از شبکه‌های عصبی برای ساخت گفتار، سرانجام توانسته صدای رایانه‌ها (و ربات‌ها) را انسانی‌تر (به صدای انسان نزدیک‌تر) کند.

��اگر صدایی که از "رایانه‌هایی که نوشته‌ها را به صدا برمی‌گردانند" شنیده‌باشید، به گمانم به گوشتان لرزان و ناخوشایند آمده است.

��"دیپ‌مایند"، بخش یادگیری‌ماشین شرکت گوگل، با یاری گرفتن از هوش مصنوعی، یک سامانه‌ی نوین برای "ساخت" گفتار گسترش داده‌ که گمان می‌رود گفتار رایانه‌ها را بهبود بخشد.
داشتن رایانه‌ای که آوای صدا را بسازد خواسته‌ی تازه‌ای نیست.

1⃣ آسان‌ترین و پیش‌پا‌افتاده‌ترین روش، بهره‌بردن از گزیده‌ی بزرگی از بریده‌های صدابرداری‌شده‌ی گفتار انسان است. در شگردی به نام "ساخت زنجیروار" این بریده‌ها برای ساخت آواهای بزرگتر، واژه‌ها، و جمله‌ها به هم پیوند می‌خورند. برای همین بسیاری از گفتارهایی که رایانه‌ها می‌سازند از ایراد‌ها، دگرگونی‌های دم‌به‌دم در زیروبمی آوا، و لرزان بودن رنج می برند.

2⃣در رویکردی دیگر، الگو‌های ریاضی برای بازسازی آواهای شناخته‌شده(حرف) به‌کارگرفته و سپس با چیدن آنها در کنار هم، واژه‌ها و جمله‌ها ساخته می‌شوند. اگر چه گفتار با این روش (که "روش پارامتریک" نامیده می‌شود) ایراد کمتری دارد، ولی صدا هنوز همانند ربات است.

�� آنچه در این دو روش یکسان است، سرهم‌بندی تکه‌های صدا به جای ساخت موج‌های صدای کامل از آغاز است.

3⃣رویکرد "دیپ‌مایند" ساخت موج‌های صدای کامل از آغاز است. در "وِیوْنِت (WaveNet)" که یک مدل برای ساخت آوای خام است، ��برش‌هایی از صداهای یک انسان و��همچنین ویژگی‌های زبانی و آوایی صداها به شبکه عصبی "کان وُلُوشِن" (Convolutional neural network) داده میشود.

بدین‌گونه الگو‌های هر دو این ویژگی ‌ها به شبکه شناسانده میشود.

��در این روش، رایانه با رشته‌ای از ویژگی‌ها از صدایی تازه که از روی یک نوشته ساخته شده‌‌، روبرو می‌شود و تلاش می‌کند موج خام آن صدا را از آغاز بسازد.

��این کار را گام به گام انجام می‌دهد،

نخست یک نمونه از موج صدا می‌سازد، سپس گام‌به‌گام آن را بهبود می‌دهد -هر بار از داده‌های (اطلاعات) بار پیشین برای ساخت نمونه بعدی بهره می‌گیرد.

��صدای ساخته‌شده با این روش در سنجش با روش‌های "زنجیروار" و "پارامتریک" بسیار بهتر و به صدای انسان نزدیکتر است.

�� نمونه‌ صداهایی از هر سه روش را در اینجا بشنوید .��

نزدیک‌تر شدن صدای رایانه و ربات به صدای انسان

��این روش نیازمند توان پردازش بسیار زیادی است. WaveNet برای ساخت شکل موج کامل، با فرآیندهای شبکه عصبی خود ۱۶۰۰۰ نمونه از صدا را در هر ثانیه می‌سازد تا سرانجام صدایی با کیفیت برابر با "صدای انسان در تلفن و تماسهای اینترنتی" بیرون دهد!

�� بنابراین و به گفته‌ی فردی آگاه در "دیپ‌نت" روشن است که گوگل به این زودی‌ها در هیچ یک از فرآورده‌های خود از این رویکرد بهره‌ نخواهد برد.

��خواندن یک نوشته تنها کمبود رایانه‌ها نیست! هنوز تفسیر گفتار و واژه‌ی نوشته شده نیز برای سامانه‌های هوش مصنوعی بسیار دشوار است.

��دست‌کم اکنون رایانه‌ها با ساختن موج کامل صدا، آنچه را که برای "اندیشیدن هوشمندانه" نیاز است در دست داشته و روزی، با پیشرفت بیشتر این سامانه‌ها، آن را با ما در میان خواهندگذاشت.
نزدیک‌تر شدن صدای رایانه و ربات به صدای انسان

**Sina homaei** · 2018/05/01, 20:20

نزدیک‌تر شدن صدای رایانه و ربات به صدای انسان

شرکت "دیپ‌مایند" با بهره‌گیری از شبکه‌های عصبی برای ساخت گفتار، سرانجام توانسته صدای رایانه‌ها (و ربات‌ها) را انسانی‌تر (به صدای انسان نزدیک‌تر) کند.
👾چهره‌ی ربات، 🎤صدای فرشته!👼

چکیده:
شرکت "دیپ‌مایند" با بهره‌گیری از شبکه‌های عصبی برای ساخت گفتار، سرانجام توانسته صدای رایانه‌ها (و ربات‌ها) را انسانی‌تر (به صدای انسان نزدیک‌تر) کند.

🔹اگر صدایی که از "رایانه‌هایی که نوشته‌ها را به صدا برمی‌گردانند" شنیده‌باشید، به گمانم به گوشتان لرزان و ناخوشایند آمده است.

🔹"دیپ‌مایند"، بخش یادگیری‌ماشین شرکت گوگل، با یاری گرفتن از هوش مصنوعی، یک سامانه‌ی نوین برای "ساخت" گفتار گسترش داده‌ که گمان می‌رود گفتار رایانه‌ها را بهبود بخشد.
داشتن رایانه‌ای که آوای صدا را بسازد خواسته‌ی تازه‌ای نیست.

1⃣ آسان‌ترین و پیش‌پا‌افتاده‌ترین روش، بهره‌بردن از گزیده‌ی بزرگی از بریده‌های صدابرداری‌شده‌ی گفتار انسان است. در شگردی به نام "ساخت زنجیروار" این بریده‌ها برای ساخت آواهای بزرگتر، واژه‌ها، و جمله‌ها به هم پیوند می‌خورند. برای همین بسیاری از گفتارهایی که رایانه‌ها می‌سازند از ایراد‌ها، دگرگونی‌های دم‌به‌دم در زیروبمی آوا، و لرزان بودن رنج می برند.

2⃣در رویکردی دیگر، الگو‌های ریاضی برای بازسازی آواهای شناخته‌شده(حرف) به‌کارگرفته و سپس با چیدن آنها در کنار هم، واژه‌ها و جمله‌ها ساخته می‌شوند. اگر چه گفتار با این روش (که "روش پارامتریک" نامیده می‌شود) ایراد کمتری دارد، ولی صدا هنوز همانند ربات است.

🔹 آنچه در این دو روش یکسان است، سرهم‌بندی تکه‌های صدا به جای ساخت موج‌های صدای کامل از آغاز است.

3⃣رویکرد "دیپ‌مایند" ساخت موج‌های صدای کامل از آغاز است. در "وِیوْنِت (WaveNet)" که یک مدل برای ساخت آوای خام است، 🔸برش‌هایی از صداهای یک انسان و🔸همچنین ویژگی‌های زبانی و آوایی صداها به شبکه عصبی "کان وُلُوشِن" (Convolutional neural network) داده میشود.

بدین‌گونه الگو‌های هر دو این ویژگی ‌ها به شبکه شناسانده میشود.

🔹در این روش، رایانه با رشته‌ای از ویژگی‌ها از صدایی تازه که از روی یک نوشته ساخته شده‌‌، روبرو می‌شود و تلاش می‌کند موج خام آن صدا را از آغاز بسازد.

🔸این کار را گام به گام انجام می‌دهد،

نخست یک نمونه از موج صدا می‌سازد، سپس گام‌به‌گام آن را بهبود می‌دهد -هر بار از داده‌های (اطلاعات) بار پیشین برای ساخت نمونه بعدی بهره می‌گیرد.

🔸🔸صدای ساخته‌شده با این روش در سنجش با روش‌های "زنجیروار" و "پارامتریک" بسیار بهتر و به صدای انسان نزدیکتر است.

📢 نمونه‌ صداهایی از هر سه روش را در اینجا بشنوید .👇👇

نزدیک‌تر شدن صدای رایانه و ربات به صدای انسان

🔹این روش نیازمند توان پردازش بسیار زیادی است. WaveNet برای ساخت شکل موج کامل، با فرآیندهای شبکه عصبی خود ۱۶۰۰۰ نمونه از صدا را در هر ثانیه می‌سازد تا سرانجام صدایی با کیفیت برابر با "صدای انسان در تلفن و تماسهای اینترنتی" بیرون دهد!

🔸🔸 بنابراین و به گفته‌ی فردی آگاه در "دیپ‌نت" روشن است که گوگل به این زودی‌ها در هیچ یک از فرآورده‌های خود از این رویکرد بهره‌ نخواهد برد.

🔹خواندن یک نوشته تنها کمبود رایانه‌ها نیست! هنوز تفسیر گفتار و واژه‌ی نوشته شده نیز برای سامانه‌های هوش مصنوعی بسیار دشوار است.

🔶دست‌کم اکنون رایانه‌ها با ساختن موج کامل صدا، آنچه را که برای "اندیشیدن هوشمندانه" نیاز است در دست داشته و روزی، با پیشرفت بیشتر این سامانه‌ها، آن را با ما در میان خواهندگذاشت.
نزدیک‌تر شدن صدای رایانه و ربات به صدای انسان

**Sina homaei** · 2018/05/01, 20:21

صحبت انسان گونه ربات ها از طریق هوش مصنوعی گوگل

هوش مصنوعی DeepMind گوگل می تواند ماشین ها را به گونه ای در آورد که شبیه انسان صحبت کنند.کلیک – ممکن است به یوتیوپ سری زده باشید و کلیپ های ویدیویی که کامپیوتر مقالات و اخبار را می خواند دیده باشید. حتما می توانید صدای روبات را از صدای طبیعی یک انسان تشخیص دهید.
راه بسیاری طولانی از Danger! Will Robinson آمده ایم، ولی هنوز صداهای کامپیوتری به صدای طبیعی خیلی نزدیک نشده اند و اگر صدایی شبیه تر تولید می شود، هنوز کامپیوترها نمی توانند مانند یک انسان که بعد از فکر کردن به صحبت می پردازد سخن بگویند.
به گزارش کلیک، در حال حاضر، یک ذهن درخشان پشت DeepMind وجود دارد که در این مورد مدعی به حساب می آید. گوگل از یک برنامه تلفیق صدا در WaveNet که توسط هوش مصنوعی عصبی عمیق طراحی شده است خبر داد.
با نگاهی به برنامه هایی مانند جستجوی صوتی گوگل می توان از چالشی که در تلفیق نمونه هایی از این دست وجود دارد سر در آورد.
یکی از روش هایی که اخیرا مورد استقبال همگان قرار گرفته است، روش تبدیل متن به گفتار است که قطعاتی از صداهای ضبط شده را با هم تلفیق می کند.
در این روش، مساله چالش برانگیز اینجاست که در حال حاضر تلفیق و دستکاری و تغییر بر روی قطعات صوتی مختلف، نمی تواند به یک چیز جدید منجر شود.
یک روش دیگر، روش TTS پارامتریک است که از طریق یک vocoder صدای طبیعی تولید می کند. vocoder در واقع یک تلفیق کننده است که از طریق تجزیه و تحلیل بر روی صدای ورودی، صدا تولید می کند. اما خبر جدید گوگل!
WaveNet گوگل یک رویکرد کاملا متفاوت را به کار می گیرد.
این برنامه به جای تجزیه و تحلیل صوت، از آن ها یاد می گیرد. یعنی مانند بسیاری از سیستم های عصبی عمیق کار می کند. این برنامه می تواند با حداقل ۱۶۰۰۰ نمونه در ثانیه کار کند و نمونه های صوتی خام تولید کند. این تولید صدا بدون دخالت انسان انجام می شود و برای انجام این کار، از محاسبات آماری برای پیش بینی قطعات صدایی که نیاز است استفاده می کند.

همچنین لازم به ذکر است که سیستم قادر به تلفیق موسیقی نیز می باشد، یعنی می تواند هر الگوی صوتی را آنالیز کند و فقط مربوط به تجزیه و تحلیل گفتار نیست. مطمئنا این سیستم می تواند بدون ورودی، گفتار را مورد تجزیه و تحلیل قرار دهد.
تفاوت این رویکرد با روش TTS در این است که TTS همیشه به ورودی نیاز دارد، در حالی که WaveNet قادر به ایجاد صدا بدون داشتن نقشه راه است.
در نتیجه، یک رشته از صداها را خواهید داشت که مانند صدای تولید شده از حرکات دهان می باشد، در حالی که یک ربات پشت آن است.
نکته آخر اینکه، WaveNet یک مدل مولد عمیق از شکل موج های صوتی خام است. این نشان دهنده پتانسیل بالای سیستم WaveNet برای ایجاد صدای واقعی به وسیله کامپیوتر است.
https://click.ir/1395/06/29/google-a...st-like-human/

**Sina homaei** · 2018/05/01, 20:21

اشیا تا چند سال دیگر انسان ها را درک می کنند / آینده در احاطه هوش مصنوعی

سال ها از ساخت نخستین دستگاه مبتنی بر هوش مصنوعی می گذرد و شاید بتوان ماشین حساب ها را نخستین دستاورد این فناوری نامید. اما حالا با گذشت زمان نسبتا کوتاهی از ساخت نخستین ماشین حساب، هوش مصنوعی به قدری پیشرفت داشته که بسیاری از امور زندگی ما را مستقیم و غیرمستقیم در تصاحب خود قرار داده است. دستگاه های خودپرداز، رایانه ها و سیستم عامل ها، تلفن های همراه و بسیاری از دستگاه های پیرامون ما نمونه هایی از تجهیزاتی هستند که از هوش مصنوعی استفاده می کنند. البته پیش بینی ها نشان می دهد تا کمتر از 10 سال آینده این فناوری به قدری توسعه می یابد که می توان رایانه های امروزی را نمونه منسوخ شده ای از هوش مصنوعی عنوان کرد.

پیشرفـت در ساخت خودرو های خودران، دستیار های صوتی در سیستم عامل ها و از همه مهم تر روبات های هوشمند، از متحول شدن زندگی روز مره انسان ها و حتی دیگر جانداران در سال های نه چندان دور دلالت دارد کـــه همگی در سیطـــره هوش مصنوعی قرار می گیرند. محمدرضـــا ذوالــقـــدر، کارشناس ارشد مهندسی کامپیوتر و هوش مصنوعی درباره آینده این علم به « فرصت امروز» گفت: این روزها خبر های زیادی از روبات های احساساتی یا دستگاه هایی که قادر به یادگیری هستند منتشر می شود و این بیانگر آن است که در آینده ای نزدیک هوش مصنوعی بیشتر زندگی ما را تحت تسلط خواهد گرفت و خدمات زیادی ارائه خواهد داد. وی افــزود: بیشتــــر شرکت های بزرگ فناوری در حال رقابت برای توسعه هرچه بیشتر این علم هستند و گوگل، مایکروسافت و اپل سردمدار استفاده از هوش مصنوعی در خدمات مختلف خود هستند. ذوالقدر اظهار کرد: سیری اپل، کورتانای مایکروسافت و گوگل ناو نمونه هایی از هوش مصنوعی هستند که شرکت های بزرگ فناوری آنها را خلق کرده و در حال بهبود آنها هستند. وی در پاسخ به این سوال که آیا می توان به هوش مصنوعی اعتماد داشت و کار های حساس ازجمله رانندگی را به دست آن سپرد؟ گفت: البته پروژه خودرو های خودران هنوز در مرحله آزمایش است اما به طور کلی کم کم این باور در جوامع شکل خواهد گرفت که ماشین ها بسیار دقیق تر از انسان ها قادر به کار ها هستند و مطمئن باشید هوش مصنوعی در بدترین حالت 95 درصد کار ها را از انسان بهتر انجام خواهد داد. این کارشناس ادامه داد: اگر بخواهیم درهمین پروژه خودرو های خودران صحبت کنیم باید بگوییم که در سال های آینده خبری از ترافیک شهری نخواهد بود و هیچ فردی دیر به محل کار خود نخواهد رسید، چون دیگر مشکل پارک وجود نخواهد داشت و تصادفات به حداقل ممکن می رسد. ذوالقدر با اشاره به اینکه هوش مصنوعی در اکثر موارد بهتر از انسان ها عمل می کند، گفت: سرعت پاسخگویی ماشین ها از انسان ها بسیار بالا تر است و چون احساساتی ندارند، می توانند بهتر از انسان ها واکنش نشان دهند. وی افـــزود: در حــــال حاضر مشکل اصلی توسعه هوش مصنوعی ارتباط برقرار کردن با انسان ها و تعامل با دنیای بیرون است که مطمئنا در چند سال آینده این موضوع نیز تا حد بسیار زیادی برطرف خواهد شد. این کارشناس با اشاره به تصادفاتی که خودروی خودران گوگل طی چند ماه اخیر داشته است، گفت: همانطور که می دانید این اتفاقات خسارت چندانی در پی نداشته است و تازه در بیشتر این حادثه ها خودروی گوگل مقصر نبوده است، به جز در موردی که اتوبوسی با این خودرو برخورد می کند و آن هم طبق گفته های گوگل، ماشین هوشمند پیش بینی کرده که اتوبوس با دیدن آن از سرعت خود کم می کند و اجازه خواهد داد تا خودرو عبور کند، اما راننده اتوبوس این کار را انجام نداده و مستقیم به سمت ماشین حرکت کرده است. گوگل پیشرو در تکامل هوش مصنوعی گرچه شرکت های بزرگی مثل مایکروسافت و اپل برای توسعه هوش های مصنوعی هزینه های زیادی را انجام داده اند، اما اگر بخواهیم واقع بینانه به این موضوع بنگریم، باید از گوگل به عنوان سردمدار توسعه علم هوش مصنوعی یاد کنیم. این شرکت به تازگی از پروژه ای رونمایی کرده که WaveNet نام دارد و می تواند صدای انسان ها را به خوبی تقلید کند. این هوش مصنوعی که در قالب یک روبات طراحی شده می تواند با دقت بسیار بالا صحبت های انسان ها را گوش دهد و سخنان را با صدایی بسیار شبیه گوینده تقلید کند. محققان گوگل هنوز در حال توسعه این هوش مصنوعی هستند و امیدوارند در آینده بتوانند آن را طوری ارتقا دهند که قادر باشد صحبت ها را با هر لهجه ای درک کند و با صدای دلخواه، پاسخ انسان ها را بدهد.
اشیا تا چند سال دیگر انسان ها را درک می کنند / آینده در احاطه هوش مصنوعی - فرصت امروز

**Sina homaei** · 2018/05/01, 20:22

افزایش توانایی هوش مصنوعی گوگل در صحبت کردن

رایورز - امکان صحبت کردن مردم با ماشین‌ها رویایی دیرباز بود، و مدت‌ها انسان بدنبال تعامل واقعی با کامپیوتر بود.
دیپ‌مایند گوگل، واحد هوش مصنوعی مشهور این کمپانی، یک جهش اساسی کرده و آموخته است که "چگونه صحبت کند"، و بدین ترتیب گوگل ادعا می‌کند که عملکرد این محصول، دست کم ۵۰ درصد بهتر از عملکرد تمامی هوش مصنوعی‌های دیگر است.
به گزارش اینکوایرر، بر اساس بازخوردهای دریافتی از شنوندگان انسان در مواجهه با دیپ‌مایند، در یک پست در وبلاگ‌ گوگل گفته شده که فناوری WaveNet می‌تواند صداها را مثلا از زبان انگلیسی بسیار بهتر از قبل تقلید نماید.
نمودار زیر شاخص نمرات به دست آمده در تست صدا را نشان می‌دهد. با برجسته‌سازی این نکته که ویو.نت، تا چه حد پیشرفت کرده و به عبارت دیگر بقدری به صدای واقعی نزدیک است که ممکن است در آینده نزدیک تشخیص و تمایز آن از صدای واقعی انسان دشوار باشد و بتوان آن را عملا معادل صدای انسان دانست.
فایل‌های صوتی در پست وبلاگ گوگل نشان می‌دهد که این نتیجه چقدر شگفت‌انگیز است، و بدنبال آن گوگل با خوشحالی توضیح داده که آینده‌ای که انسان‌ها و کامپیوترها بتوانند با هم صحبت کنند چندان دور نیست.

این کمپانی اعلام کرده: «امکان صحبت کردن مردم با ماشین‌ها رویایی دیرباز بود، و مدت‌ها انسان بدنبال تعامل واقعی با کامپیوتر بود. با اینحال در چند سال گذشته توانایی کامپیوترها به درک گفتار، به کمک اپلیکیشن شبکه‌های طبیعی عمیق، یک انقلاب بزرگ محسوب می‌شود.»
گوگل همچنین اذعان کرده که قدرت محاسباتی لازم برای تولید خروجی مورد نظر، بسیار بالاست. در ادامه پیشرفت اخیر فعالیت گوگل در زمینه هوش مصنوعی، این شرکت به یک دستاورد جدید نیز اشاره کرده است.
به گفته گوگل WaveNet همچنین می‌تواند موسیقی و برخی از نمونه‌های جالب از پیانو را که بدون شک توسط یک انسان نواخته شده است را بخوبی تقلید کند، و این امر برای AI یک دستاورد بسیار بزرگ به شمار می‌رود.

https://rayvarz.com/news/artificial-intelligence/13613

انجمن گفتگو استارتاپ و کار آفرینی

انجمن گفتگو استارتاپ و کار آفرینی

تـــوجـــه

موضوع: به زودی تشخیص صدای انسان و هوش مصنوعی دشوار خواهد شد

لینک بک

ابزارهای موضوع

به زودی تشخیص صدای انسان و هوش مصنوعی دشوار خواهد شد

موضوعات مشابه

تشخیص بیماری با هوش مصنوعی گوگل

کاربرد مهم هوش مصنوعی _ تشخیص گفتار

استفاده از فناوری هوش مصنوعی برای تشخیص بیماری‌های قلبی

تشخیص چهره افراد از پشت دیوار ؛ هوش مصنوعی در خدمت ارتش آمریکا

نوپانا: اسکنری برای تشخیص سریع نوعی سرطان پوست

مجوز های ارسال و ویرایش

استارتاپ‌فاروم - انجمن گفتگو استارت‌آپ‌ها

دوستان ما

لینک‌های مفید