VALL-E ជា AI ថ្មីបង្កើតឡើងដោយ Microsoft សម្រាប់ចម្លងសំឡេងនិយាយរបស់អ្នកបាន
ដោយ​ ៖ ឡេង | 1 សប្ដាហ៍មុន SHARE

 

Microsoft បានប្រកាសប្រាប់ថា ពួកគេបានសិក្សាទៅលើបច្ចេកវិទ្យាឆ្លាតវៃ AI ថ្មី ដែលអាចចម្លងសំឡេងនិយាយរបស់មនុស្សបាន តាមរយៈការស្ដាប់សំឡេងដើមត្រឹមតែ 3 វិនាទីប៉ុណ្ណោះ។ AI ថ្មីនេះត្រូវបានគេដាក់ឈ្មោះឲ្យថា VALL-E ដែលវាត្រូវបានចំណាយពេលសិក្សាអស់រយៈពេល 60,000 ម៉ោង ដើម្បីឲ្យវាស្ដាប់និងគណនាពីភាសាអង់គ្លេស។

VALL-E ជា AI ប្រភេទ Text-to-Speech ដោយមានន័យថា បន្ទាប់ពីចម្លងសំឡេងរបស់យើង ឬនរណាម្នាក់រួចហើយ នឹងគ្រាន់តែសរសេរជាអក្សរ, ឃ្លា ឬប្រយោគ ដើម្បីអាចឲ្យវាអានជាសំឡេងរបស់យើងបាន។ ហេតុដូច្នេះហើយ អ្នកបង្កើតវីដេអូក៏អាចប្រើប្រាស់ VALL-E ដើម្បីឲ្យជួយនិយាយនៅក្នុងវីដេអូរបស់ពួកគេបាន។

បច្ចេកវិទ្យា AI កាន់តែរីកចម្រើនពីមួយថ្ងៃទៅមួយថ្ងៃ ដូចជា ChatGPT របស់ OpenAI ដែលត្រូវបាន Microsoft មានចំណាប់អារម្មណ៍នឹងដាក់បញ្ចូលក្នុង Word, PowerPoint និងកម្មវិធីផ្សេងៗទៀតដូចគ្នា។ អ្នកទាំងអស់គ្នាអាចចូលទៅកាន់វេបសាយខាងក្រោម ដើម្បីពិនិត្យមើលថាតើសំឡេងនិយាយ ដែលចម្លងដោយ VALL-E គឺស្រដៀងគ្នាទៅនឹងសំឡេងម្ចាស់ដើម ខ្ទង់ប៉ុន្មានភាគរយខ្លះបាន។

https://valle-demo.github.io/

បញ្ជាក់៖ នៅខាងក្រោមពាក្យ Ground Truth ជាសំឡេងម្ចាស់ដើម (មិនបានឲ្យ AI ស្ដាប់ចម្លងនោះទេ), នៅខាងក្រោមពាក្យ Speaker Prompt ជាសំឡេងដែលដាក់ឲ្យ AI ស្ដាប់ដើម្បីចម្លងតាម និងនៅក្រោមពាក្យ VALL-E ជាសំឡេងរបស់ AI និយាយចម្លងតាម។

នាពេលបច្ចុប្បន្ននេះ មុខងារ AI ឈ្មោះថា VALL-E របស់ Microsoft នៅមិនទាន់ដាក់ឲ្យប្រើប្រាស់ជាសាធារណៈនៅឡើយទេ ហើយ Microsoft ក៏មិនទាន់បានប្រាប់អំពី គោលដៅពិតប្រាកដនៃការបង្កើតវាមកនោះដែរ។

ប្រភព ៖ Microsoft
អត្ថបទទាក់ទង