در حال حاضر اگر یک صدای ضبط شده برای ما پخش شود به راحتی تشخیص میدهد که این صدای یک انسان است تا یک روبات. اما به زودی زمانی فرا خواهد رسید که با روی کار آمدن فناوریهای مختلف به سختی میتوان صدای انسان را از روبات تشخیص داد و یکی از جدیدترین فناوریها در این زمینه یک سیستم هوش مصنوعی به نام WaveNet است که توسط تیم DeepMind شرکت گوگل توسعه داده شده است. با تک شات همراه باشید.
تیم DeepMind شرکت گوگل سابقه خوبی در زمینه طراحی شبکههای عصبی دارد و قبلا موفق شد سیستم هوش مصنوعی AlphGo را خلق کند که یکی از بهترین بازیکنان جهانی بازی Go را شکست داد.
توسعه دهندگان در حال حاضر برای خلق برنامههای سخنگو، یکی از دو راهکار موجود را مورد استفاده قرار میدهند. یکی از این راهکارها شامل استفاده از مجموعهای بزرگ از لغات و عبارات است که توسط یک فرد واحد گفته شدهاند و به این ترتیب دستکاری کردن صداها و زیر و بمی و لحن صدا دشوار خواهد شد. در راهکار دیگر لغات به صورت الکترونیکی و مبتنی بر جملات و قواعد مختلف تولید میشوند. در راهکار دوم دستکار کردن جملات و کلمات ساده تر است، اما این صدا کاملا روباتیک به نظر میرسد.
تیم گوگل به منظور ایجاد یک برنامه سخنگو که کاملا شبیه به صدای انسان باشد، از شکلهای موج صوتی که توسط یک انسان واقعی گفته شده اند به عنوان داده ورودی شبکه عصبی خود استفاده کرده است. شکلهای موج در واقع نمایش صوتی اشکالی هستند که صوت به آن شکلها در می آید.
اشکال صوتی همان تصاویری هستند که برخی از مدیا پلیرها موقع پخش آهنگهای مختلف آنها را نمایش میدهند. به این ترتیب هوش مصنوعی WaveNet میتواند با خلق امواج صوتی به صورت مستقل، حرف بزند.
به این ترتیب اگر شما از این هوش مصنوعی بخواهید که یک متن نوشته شده را بخواند، WaveNet ابتدا متن شما را به مجموعهای از واجها و هجاها تبدیل میکند و سپس آنها را بیان میکند. افرادی که در تست آزمایش این هوش مصنوعی شرکت کنند معتقد بودند که این سیستم جدید در مقایسه به سایر راهکارها، شباهت بسیار بیشتری به صدای انسان دارد.
دانشجویان مهندسی پزشکی شوشتر...
ما را در سایت دانشجویان مهندسی پزشکی شوشتر دنبال می کنید
برچسب : نویسنده : shoushtar-bmea بازدید : 163 تاريخ : دوشنبه 22 شهريور 1395 ساعت: 3:30