เปิดหรือปิดการรู้จำคำพูดอัตโนมัติ คำแนะนำเกี่ยวกับการรู้จำเสียงใน Windows วิธีการตั้งค่าการรู้จำเสียงใน Windows 7

การควบคุมหน้าจอสัมผัสเป็นมาตรฐานอยู่แล้ว ระบบล่าสุด เช่น Windows 8 คำสั่งเสียง "เข้าใจ" ควรนำไปสู่ความจริงที่ว่าการสื่อสารของเรากับคอมพิวเตอร์จะง่ายขึ้น เป็นธรรมชาติมากขึ้น และ... เป็นธรรมชาติมากขึ้น ฉันจะบอกคุณว่าวันนี้มีลักษณะอย่างไร

ประวัติเล็กน้อย - การสื่อสารกับเครื่องจักรพัฒนาขึ้นอย่างไร

วิธีที่เราสื่อสารกับคอมพิวเตอร์มีการพัฒนาตลอดหลายปีที่ผ่านมา อินเทอร์เฟซแรกที่มนุษย์สามารถออกคำสั่งได้คือบัตรเจาะซึ่งมีอายุย้อนไปถึงปี 1832 ใช้ในเครื่องจักรทำผ้า คีย์บอร์ดเริ่มใช้ในปี 1960 สองทศวรรษต่อมา เมาส์มาตรฐานได้เข้าร่วมและยังคงใช้อยู่จนถึงปัจจุบัน แม้ว่าเมาส์จะแชร์พลังกับแทร็กแพด แต่ก็ยังเป็นประเภทควบคุมที่ได้รับความนิยมมากที่สุด ต้องขอบคุณสมาร์ทโฟนและแท็บเล็ต อินเทอร์เฟซแบบสัมผัสและท่าทางจึงได้รับความนิยมอย่างมาก ซึ่งใช้เพื่อควบคุม Xbox 360 Kinect โดยเฉพาะ หลังจากหน้าจอสัมผัสและท่าทางมาถึงการควบคุมด้วยเสียง แต่โซลูชันนี้ยังด้อยพัฒนามากจนบางครั้งคุณจะไม่ได้ยินเกี่ยวกับมันด้วยซ้ำ

การตั้งค่าการรู้จำเสียงใน Windows 8

ขออภัย การควบคุมด้วยเสียงยังไม่พร้อมใช้งานในภาษารัสเซีย ภาษาที่รองรับในปัจจุบัน ได้แก่ อังกฤษ ฝรั่งเศส เยอรมัน ญี่ปุ่น เกาหลี จีน และสเปน Microsoft ได้ตัดสินใจที่จะมุ่งเน้นไปที่ประเทศที่ใหญ่ที่สุดและพัฒนามากที่สุด แต่เป็นไปได้ว่าเมื่อเวลาผ่านไปจะเพิ่มคุณสมบัตินี้ให้กับประเทศของเราเช่นกัน ถ้าลองเริ่มดูก็จะสบถแบบนี้

หากคุณยังคงต้องการทดสอบโซลูชันนี้ คุณต้องกำหนดค่าระบบ (เปลี่ยนภาษา) และเรียนรู้คำศัพท์สองสามคำเป็นภาษาอังกฤษ ในการดำเนินการนี้ คุณต้องไปที่แผงควบคุมและเลือกภาษา หากคุณไม่มีภาษาอื่นที่ไม่ใช่ภาษารัสเซีย คุณต้องคลิกปุ่ม "เพิ่มภาษา" จากนั้นเลือกภาษาใดภาษาหนึ่งที่รองรับ ในกรณีของเราคือ "อังกฤษ (สหรัฐอเมริกา)" เราเห็นว่ามีเพียงเค้าโครงในภาษานี้เท่านั้น เราดับเบิลคลิก มันจะตรวจสอบความพร้อมใช้งานของภาษาสำหรับอินเทอร์เฟซ หลังจากตรวจสอบแล้ว คลิก "ดาวน์โหลดและติดตั้งชุดภาษา" และกระบวนการจะเริ่มขึ้น เราอดทน รอให้โหลด เมื่อกระบวนการนี้เสร็จสิ้น ให้ตั้งค่าภาษาเริ่มต้นเป็นภาษาอังกฤษ

ตอนนี้คุณต้องไปที่หน้าจอเริ่มของ Windows 8 (เรียงต่อกัน) ป้อน "การรู้จำเสียงของ Windows" ในการค้นหาแล้วกด Enter

คุณจึงสามารถเรียกใช้เครื่องมือจดจำเสียงได้ เมื่อคุณเริ่มใช้งานครั้งแรกระบบจะเสนอให้กำหนดค่าไมโครโฟนหลังจากเลือกแล้วให้พูดอะไรบางอย่างเพื่อตรวจสอบ

ต่อไปเสนอให้เข้ารับการฝึกอบรม ใช้งานได้นานถึง 15-20 นาที แต่มีประโยชน์มากและให้ข้อมูลพื้นฐานเกี่ยวกับวิธีใช้ฟีเจอร์ต่างๆ แต่ถ้าคุณไม่เก่งภาษาอังกฤษ ผมว่าไม่คุ้ม เสียเวลา เข้าใจอะไรยาก ลุยศึกได้เลย

วิธีการทำงาน

เพื่อให้คอมพิวเตอร์เริ่มจดจำคำพูดของคุณ คุณต้องพูดว่า "เริ่มฟัง" (ซึ่งหมายถึงเริ่มฟัง) หรือกดปุ่มไมโครโฟนเพื่อเริ่มโหมดการฟัง ตอนนี้คุณสามารถเปิดแอปพลิเคชันหรือเพียงป้อนคำลงในโปรแกรมแก้ไขข้อความ เบราว์เซอร์ หรือแถบค้นหา

สิ่งที่เราสามารถทำได้

โดยหลักการแล้ว ความเป็นไปได้นั้นมีมากมาย นอกเหนือจากคำมาตรฐานแล้ว คุณสามารถสร้างคำสั่งของคุณเองได้ คุณสมบัติหลักแสดงอยู่ในตาราง

การกระทำ จะพูดอะไร.
เลือกองค์ประกอบใด ๆ ตามชื่อของมัน คลิกไฟล์ เริ่ม ดู
เลือกองค์ประกอบหรือไอคอนใดๆ คลิกถังรีไซเคิล คลิกคอมพิวเตอร์ คลิก(ชื่อไฟล์)
ดับเบิลคลิกหรือดับเบิลคลิกองค์ประกอบใดๆ ดับเบิลคลิกถังรีไซเคิล ดับเบิลคลิกคอมพิวเตอร์
สลับระหว่างแอปพลิเคชันที่เปิดอยู่ สลับไปที่ Paint, สลับไปที่ WordPad

เลื่อน

เลื่อนขึ้น; เลื่อนลง;
เลื่อนไปทางซ้าย เลื่อนไปทางขวา

รวมย่อหน้าใหม่หรือบรรทัดใหม่ในเอกสาร

ย่อหน้าใหม่ สายใหม่

เลือกคำในเอกสาร

การแก้ไขคำ

คำที่ถูกต้อง

เลือกและลบคำเฉพาะ

แสดงรายการคำสั่งที่เกี่ยวข้อง

รีเฟรชคำสั่งคำพูด

เปิดโหมดการฟัง

ปิดโหมดการฟัง

ยุบไมโครโฟน

ลดการรู้จำคำพูดให้เหลือน้อยที่สุด

ดูวิธีใช้และการสนับสนุนของ Windows

ฉันจะทำอย่างไร?
ตัวอย่างเช่น: ฉันจะติดตั้งเครื่องพิมพ์ได้อย่างไร

หากคุณไม่ทราบวิธีการออกเสียงวลี ฉันขอแนะนำให้คุณใช้ Google Translate หรือ http://uchilochka.rf (เขาเข้าใจไซต์นี้ดีขึ้น)

ข้าพเจ้ามีความปรารถนาที่จะเขียนคำสั่งที่ประกอบด้วยคำกระฎุมพีธรรมดาๆ ซึ่งฉันสามารถออกเสียงได้ ดังนั้นเขาจึงไม่ให้ฉันทำเช่นนี้ เขาไม่สามารถเปิดตัวแก้ไขคำสั่งได้ ผลก็คือเขาเข้าใจการออกเสียงคำว่า หนึ่ง สอง และ เปิด ของฉันอย่างสมบูรณ์แบบ ด้วยแป้นหมุนนี้ คุณสามารถเปิดแอปพลิเคชันตามหมายเลขบนหน้าจอหลักได้ ก่อนอื่นให้พูดตัวเลข จากนั้นพูดว่า OPEN แน่นอนว่าไม่มากนัก แต่ฉันคิดว่าการทดลองนี้ประสบความสำเร็จ คงไม่แย่ถ้า Microsoft เปิดตัวภาษารัสเซียซึ่งใช้แทนรีโมทคอนโทรลได้ดี

ด้วยการรู้จำเสียงใน Windows ไม่จำเป็นต้องใช้แป้นพิมพ์และเมาส์ คุณสามารถควบคุมคอมพิวเตอร์ของคุณโดยใช้เสียงและข้อความตามคำบอกแทนได้

บันทึก: การรู้จำคำพูดมีให้บริการในภาษาต่อไปนี้เท่านั้น: อังกฤษ (สหรัฐอเมริกาและสหราชอาณาจักร), ฝรั่งเศส, สเปน, จีน, จีนกลาง (จีนตัวย่อและตัวเต็ม) และเยอรมัน

การตั้งค่าการรู้จำเสียงใน Windows 8.1

ก่อนที่คุณจะสามารถใช้การรู้จำเสียงได้ คุณต้องดำเนินการหลายขั้นตอนก่อน ก่อนอื่นคุณต้องตั้งค่าไมโครโฟนของคุณ จากนั้นคอมพิวเตอร์ก็สามารถถูกฝึกให้จดจำเสียงนั้นได้

เพื่อตั้งค่าไมโครโฟน

ก่อนตั้งค่าการรู้จำเสียง ตรวจสอบให้แน่ใจว่าไมโครโฟนเชื่อมต่อกับคอมพิวเตอร์แล้ว

  1. ป้อนข้อความในช่องค้นหา การตั้งค่าไมโครโฟน การตั้งค่าไมโครโฟน.
  2. ทำตามคำแนะนำที่ปรากฏบนหน้าจอ

บันทึกตอบ: หากเป็นไปได้ ให้ใช้ไมโครโฟนของชุดหูฟังเนื่องจากมีโอกาสน้อยที่จะรับเสียงรบกวนรอบข้าง

วิธีฝึกคอมพิวเตอร์ให้จดจำคำพูด

คุณสมบัติการรู้จำเสียงใช้โปรไฟล์พิเศษเพื่อจดจำคำสั่งเสียงและคำสั่งเสียงของคุณ ยิ่งคุณใช้การรู้จำคำพูดมากเท่าไร โปรไฟล์คำสั่งเสียงของคุณก็จะยิ่งมีรายละเอียดมากขึ้นเท่านั้น ช่วยให้คอมพิวเตอร์เข้าใจคุณได้ดีขึ้น

  1. แผงการค้นหาสามารถเปิดได้โดยใช้แป้นพิมพ์โดยกดปุ่ม Win + Q
  2. ป้อนข้อความในช่องค้นหา การรู้จำเสียงแล้วกดปุ่มหรือเลือก การรู้จำเสียง.
  3. คลิกปุ่ม สอนคอมพิวเตอร์.
  4. ทำตามคำแนะนำในขณะที่คุณเรียนรู้การจดจำเสียง

การใช้การรู้จำเสียง

คุณสามารถใช้เสียงของคุณเพื่อทำงานหลายอย่าง เช่น กรอกแบบฟอร์มออนไลน์หรือพิมพ์ตัวอักษร เมื่อคุณพูดใส่ไมโครโฟน การรู้จำเสียงจะเปลี่ยนคำพูดเป็นข้อความที่ปรากฏบนหน้าจอ

หากต้องการกำหนดข้อความโดยใช้การรู้จำคำพูดของ Windows 8.1

  1. เลื่อนนิ้วของคุณเข้ามาอย่างรวดเร็วจากขอบขวาของหน้าจอ จากนั้นแตะแถบค้นหา (หากคุณใช้เมาส์ ให้เลือกมุมขวาบนของหน้าจอ เลื่อนตัวชี้เมาส์ลง จากนั้นเลือกแผงการค้นหา)
  2. แผงการค้นหาสามารถเปิดได้โดยใช้แป้นพิมพ์โดยกดปุ่ม Win + Q
  3. ป้อนข้อความในช่องค้นหา การรู้จำเสียงพูดแล้วกดปุ่มหรือเลือก การรู้จำเสียงของ Windows.
  4. พูดว่า “เริ่มฟัง” หรือกดปุ่มบนไมโครโฟนเพื่อเปิดใช้งานโหมดการฟัง
  5. เปิดแอปที่คุณต้องการใช้หรือไฮไลท์ช่องข้อความที่คุณต้องการกำหนดข้อความ
  6. พูดข้อความที่คุณต้องการสั่ง

เพื่อแก้ไขข้อผิดพลาด

  • ข้อผิดพลาดสามารถแก้ไขได้สามวิธี
    • หากต้องการแก้ไขวลีสุดท้ายที่พูด ให้พูดว่า “โปรดแก้ไขสิ่งนี้”
    • หากต้องการปรับปรุงคำหนึ่งคำ ให้พูดว่า "ถูกต้อง" แล้วพูดคำที่คุณต้องการแก้ไข หากคำซ้ำหลายครั้ง กรณีทั้งหมดของคำนั้นจะถูกไฮไลต์ และคุณสามารถเลือกกรณีที่คุณต้องการปรับปรุงได้
    • ในกล่องโต้ตอบ แผงทางเลือกพูดหมายเลขของรายการที่เกี่ยวข้อง แล้วพูดว่าตกลง

เพื่อเพิ่มหรือเปลี่ยนคำในพจนานุกรม

ด้วยพจนานุกรมคำพูดของ Windows 8.1 คุณสามารถเพิ่มคำของคุณเอง บล็อกความสามารถในการกำหนดคำเฉพาะ ปรับปรุงคำในพจนานุกรม หรือลบออกได้

  1. เลื่อนนิ้วของคุณเข้ามาอย่างรวดเร็วจากขอบขวาของหน้าจอ จากนั้นแตะแถบค้นหา (หากคุณใช้เมาส์ ให้เลือกมุมขวาบนของหน้าจอ เลื่อนตัวชี้เมาส์ลง จากนั้นเลือกแผงการค้นหา)
  2. แผงการค้นหาสามารถเปิดได้โดยใช้แป้นพิมพ์โดยกดปุ่ม Win + Q
  3. ป้อนข้อความในช่องค้นหา การรู้จำเสียงพูดแล้วกดปุ่มหรือเลือก การรู้จำเสียงของ Windows.
  4. พูดว่า “เริ่มฟัง” หรือกดปุ่มไมโครโฟนเพื่อเปิดใช้งานโหมดการฟัง
  5. พูดว่า "เปิดพจนานุกรมคำพูด" แล้วทำอย่างใดอย่างหนึ่งต่อไปนี้:
    • หากต้องการเพิ่มคำลงในพจนานุกรม ให้พูดว่า “เพิ่มคำใหม่” จากนั้นปฏิบัติตามคำแนะนำบนหน้าจอ
    • ในการป้องกันไม่ให้ป้อนคำตามคำใดโดยเฉพาะ ให้พูดว่า “ป้องกันไม่ให้ป้อนคำตามคำบอก” จากนั้นปฏิบัติตามคำแนะนำบนหน้าจอ

ควบคุมคอมพิวเตอร์ของคุณโดยใช้การรู้จำเสียง

บันทึก: เมื่อใดก็ตามที่คุณต้องการตรวจสอบว่าคำสั่งใดที่คุณสามารถใช้ได้ ให้พูดว่า “ฉันพูดอะไรได้บ้าง”

ถึง... พูดสิ...

เปิดหน้าจอการเปิดตัว

เปิดแผงฟังก์ชั่นแผง

เปิดแผงการค้นหา

แสดงแอปพลิเคชันทั้งหมด

การใช้งาน

เริ่มต้นด้วยแอปพลิเคชัน

คลิกขวาแล้วพูดว่า Windows C

ใช้แอพ

พูดสิ่งที่คุณต้องการจะทำ ตัวอย่างเช่น เปลี่ยนเป็นองศาเซลเซียสในแอพสภาพอากาศ

เลือกองค์ประกอบใด ๆ โดยใช้ชื่อของมัน

พูดไฟล์; เริ่ม; ดู

เลือกองค์ประกอบหรือไอคอนใดๆ

พูดรถเข็น; พูดคอมพิวเตอร์; บอกชื่อไฟล์มาครับ

ดับเบิลคลิกที่องค์ประกอบ

ดับเบิลคลิกถังขยะ; ดับเบิลคลิกคอมพิวเตอร์ ดับเบิลคลิกที่ชื่อไฟล์

ไปที่เปิดแอปพลิเคชัน

อ้างอิงถึงสี; ไปที่ WordPad; ไปที่ชื่อโปรแกรม ไปที่แอปพลิเคชัน

เลื่อนไปในทิศทางที่ต้องการ

เลื่อนขึ้น; เลื่อนลง; ดำเนินการเลื่อนไปทางซ้าย; ดำเนินการเลื่อนไปทางขวา

แทรกย่อหน้าหรือบรรทัดใหม่ในเอกสาร

ย่อหน้าใหม่ บรรทัดใหม่

เลือกคำในเอกสาร

ตั้งค่าการแสดงออก

เลือกคำและเริ่มแก้ไข

แก้ไขการแสดงออก

เน้นและลบคำเฉพาะ

ลบการแสดงออก

แสดงรายการคำสั่งที่สามารถดำเนินการได้

ฉันจะพูดอะไรได้บ้าง?

อัปเดตรายการคำสั่งเสียงที่มีอยู่

อัปเดตคำสั่งคำพูด

เปิดใช้งานโหมดการฟัง

เริ่มฟัง

ปิดการใช้งานโหมดการฟัง

หยุดฟัง

ย้ายแผงไมโครโฟน คุณสมบัติการรู้จำเสียงพูด

ย้ายการรู้จำคำพูด

ย่อแผงไมโครโฟนให้เล็กสุด

ยุบการรู้จำคำพูด

ดูเนื้อหา Windows Help and Support เฉพาะงาน

จะทำอย่างไร?

พูดประมาณว่า “ฉันจะติดตั้งเครื่องพิมพ์ได้อย่างไร”

โปรดทราบว่าคำสั่งนี้จะใช้ได้เฉพาะเมื่อคุณใช้การรู้จำเสียงภาษาอังกฤษแบบสหรัฐอเมริกาเท่านั้น

เพื่อน ๆ วันก่อนเราได้ดูหนึ่งในนวัตกรรมที่นำมาใช้กับ Windows 10 โดย Fall Creators Update - - Microsoft สัญญาว่าจะรองรับการป้อนข้อมูลด้วยเสียงในภาษารัสเซียในอนาคต แต่ไม่ได้ระบุว่าอนาคตนี้ใกล้หรือไกลในอนาคตอันใกล้ บางทีนี่อาจเป็นเวลาที่ Cortana จะสามารถพูดได้และที่สำคัญที่สุดคือเข้าใจภาษารัสเซีย ไม่มีประโยชน์ที่จะรอให้ Microsoft สอน Windows 10 ให้เข้าใจเรา หากบางสิ่งไม่อยู่ในสภาพแวดล้อมของระบบ ก็สามารถนำไปใช้งานโดยใช้ซอฟต์แวร์บุคคลที่สามได้เกือบทุกครั้ง จริงๆแล้วเราจะพูดถึงพวกเขาในบทความนี้ ด้านล่างนี้เราจะดูวิธีการต่างๆ ที่คุณสามารถใช้ไมโครโฟนในตัวแล็ปท็อปหรือเชื่อมต่อกับพีซีเพื่อป้อนคำค้นหาด้วยเสียงและกำหนดข้อความในเอกสาร

1. “ตกลงอลิซ” และการค้นหาด้วยเสียงของ Google สำหรับคำค้นหา

ไม่ชัดเจนว่าทำไม Google ยังไม่ได้รวมเทคโนโลยีนี้เข้ากับอินเทอร์เฟซ YouTube แต่ไม่ว่าในกรณีใด คุณสามารถค้นหาวิดีโอในเครื่องมือค้นหาได้โดยออกเสียงข้อความค้นหาที่สำคัญ คุณเพียงแค่ต้องสลับไปที่แท็บ "วิดีโอ" ในผลการค้นหา ด้วยเหตุผลที่ชัดเจน ส่วนแบ่งส่วนใหญ่ของผลการค้นหาจะยังคงมาจาก YouTube

ผู้ที่ทำความคุ้นเคยกับมันแล้วไม่จำเป็นต้องไปที่เว็บไซต์ของเครื่องมือค้นหาในหน้าต่างเบราว์เซอร์ หลังจากติดตั้งโปรแกรมแล้ว ช่องค้นหา Yandex ที่สามารถป้อนข้อความค้นหาด้วยเสียงจะปรากฏบนทาสก์บาร์ของ Windows โดยตรง และอลิซจะสามารถตอบคำถามง่ายๆ ที่หายากได้โดยไม่ต้องใช้เครื่องมือค้นหา โดยไม่ต้องไปไกลกว่ากล่องโต้ตอบของเธอ

2. บริการเว็บ Web Speech API จาก Google

เทคโนโลยี Web Speech API ซึ่งใช้การป้อนข้อมูลด้วยเสียงในเครื่องมือค้นหาของ Google มีเว็บอินเตอร์เฟสของตัวเองที่:

https://www.google.com/intl/ja/chrome/demos/speech.html

ฟังก์ชันการทำงานของบริการเป็นแบบเรียบง่าย: ประกอบด้วยปุ่มสำหรับเปิดไมโครโฟนและช่องผลลัพธ์ซึ่งข้อความที่รู้จักจะปรากฏขึ้น

แต่คุณไม่สามารถทำการแก้ไขในช่องผลลัพธ์นี้ได้ เป็นผลให้เราได้รับผลการจดจำตามที่เป็นอยู่ และเราสามารถแก้ไขได้ด้วยโปรแกรมแก้ไขข้อความหรือแบบฟอร์มป้อนข้อมูลบางประเภทเท่านั้น ปุ่มด้านล่างช่องผลลัพธ์ “คัดลอกและวาง” จะสิ้นสุดเซสชันการป้อนข้อมูลปัจจุบัน และวางบล็อกไฮไลต์บนข้อความที่รู้จักทั้งหมดโดยอัตโนมัติ ทำเช่นนี้เพื่อความสะดวกในการคัดลอกไปยังคลิปบอร์ด

สำหรับข้อความที่รู้จัก มีตัวเลือกอื่นให้เลือกใช้งานโดยปุ่มสำหรับสร้างอีเมล เปิดตัวไคลเอนต์อีเมลที่ติดตั้งตามค่าเริ่มต้นในสภาพแวดล้อม Windows สร้างจดหมายใหม่และถ่ายโอนข้อความที่รู้จักลงไป

เป็นที่น่าสังเกตว่า Web Speech API สามารถจดจำเครื่องหมายวรรคตอนบางเครื่องหมายได้ อย่างน้อยก็เครื่องหมายจุดและลูกน้ำ ดังนั้นในระหว่างการเขียนตามคำบอก ในจุดที่มีการแทรกจุดและลูกน้ำ คุณสามารถออกเสียงสิ่งเหล่านั้นได้อย่างง่ายดาย

การไม่มีความสามารถในการแก้ไขข้อความในช่องผลลัพธ์ทำให้การใช้ Web Speech API ไม่สะดวกนักสำหรับการพิมพ์ข้อความจำนวนมาก สำหรับการเขียนตามคำบอกที่ยาวนาน ควรใช้เว็บอินเตอร์เฟสของบริการ Google Docs ซึ่งมีเทคโนโลยี Web Speech API อยู่ภายใน ใน Google เอกสาร คุณสามารถป้อนข้อความด้วยเสียง แก้ไขได้ทันที และจัดรูปแบบเอกสารไปพร้อมกัน

3. “บันทึกเสียง” บน Speechpad.Ru

เว็บไซต์อื่นที่ใช้เทคโนโลยี Web Speech API เป็นบริการป้อนข้อมูลด้วยเสียงที่ได้รับความนิยมและใช้งานได้มากที่สุดบน RuNet "Voice Notepad" ท่ามกลางหน้าที่หลัก:

  • รองรับหลายภาษา รวมถึงภาษารัสเซียและยูเครน
  • ฟิลด์การรู้จำเสียงที่เป็นผลลัพธ์พร้อมความสามารถในการแก้ไขข้อความ แปลเป็นภาษาอื่น และอัปโหลดผลลัพธ์เป็นไฟล์ TXT
  • ส่งออกวลีที่รู้จักไปยังคลิปบอร์ด
  • การถอดความ;
  • บูรณาการเข้ากับเว็บฟอร์มของเบราว์เซอร์ Chromium
  • บูรณาการเข้ากับสภาพแวดล้อม Windows และ Linux

นอกจากนี้ ใน "Voice Notepad" ตัวเลือกการป้อนข้อมูลด้วยเสียงจะเปิดและปิดโดยการกดปุ่มที่เกี่ยวข้องเท่านั้น ตัวเลือกนี้จะไม่ถูกปิดใช้งานทันทีที่เราคิดมาระยะหนึ่งเพื่อค้นหาการกำหนดความคิดที่แน่นอน เช่นเดียวกับที่เกิดขึ้นในบริการอื่น ๆ ที่ใช้ Web Speech API

และเราติดตามข้อความที่รู้จักในช่องผลลัพธ์

4. การรวม Speechpad เข้ากับเว็บฟอร์มของเบราว์เซอร์

หลังจากใช้ส่วนขยายนี้ รายการ "Speechpad" จะปรากฏในเมนูบริบทของแบบฟอร์มป้อนข้อความบนเว็บ เรากดปุ่มนี้แล้วพูดใส่ไมโครโฟน วิธีนี้ทำให้เราสามารถกำหนดบันทึกย่อใน Google Keep ได้

5. การรวม Speechpad เข้ากับสภาพแวดล้อม Windows

ความสามารถของบริการเว็บ Voice Notepad สามารถรวมเข้ากับสภาพแวดล้อม Windows ได้ และพิมพ์ข้อความด้วยเสียงในโปรแกรมระบบปฏิบัติการใดๆ - แผ่นจดบันทึกมาตรฐาน, Microsoft Word และโปรแกรมแก้ไขข้อความอื่นๆ คำพูดที่จดจำจะถูกแทรกลงในเอกสารที่แก้ไขโดยตรงโดยไม่ต้องอาศัยสื่อกลางของบริการบนเว็บหรือคลิปบอร์ด อย่างไรก็ตาม Speechpad.Ru ฟังก์ชั่นนี้ไม่ฟรีและมีราคา 100 รูเบิล ต่อเดือน มีตัวเลือกการออม: หากคุณชำระค่าบริการทันทีสำหรับไตรมาสนั้น ราคาจะอยู่ที่ 250 รูเบิล และการชำระล่วงหน้าสำหรับปีจะมีราคา 800 รูเบิล ผู้ใช้ที่ลงทะเบียนแต่ละรายสามารถทดสอบฟังก์ชันการทำงานของบริการที่รวมอยู่ในสภาพแวดล้อมระบบปฏิบัติการของตนได้ก่อน ผู้สร้าง Speechpad.Ru เสนอช่วงทดลองใช้ฟรีสองวัน วิธีที่ Voice Notepad รวมเข้ากับระบบปฏิบัติการโดยตรงโดยเฉพาะ Windows มีการอธิบายรายละเอียดบนเว็บไซต์ของ Speechpad.Ru เอง คลิกเครื่องหมายคำถามถัดจากตัวเลือกการรวมระบบ

และเราทำตามขั้นตอนทั้งหมดที่อธิบายไว้ในคำแนะนำ:

  • ติดตั้งส่วนขยายบริการข้างต้น
  • ดาวน์โหลดแพ็คเกจไฟล์การรวม
  • แตกไฟล์เก็บถาวรและรันไฟล์ install_host.bat
  • บนเว็บไซต์ Speechpad.Ru เราไปที่บัญชีผู้ใช้

คลิกปุ่ม "เปิดใช้งานช่วงทดสอบ"

และทุกครั้งที่คุณต้องการเปิดใช้งานการป้อนข้อมูลด้วยเสียง นั่นคือทั้งหมดจริงๆ ตอนนี้คุณสามารถเปิด Microsoft Word, LibreOffice Writer และโปรแกรมแก้ไขข้อความอื่นๆ และเริ่มเขียนตามคำบอกได้ ข้อความที่รู้จักจะปรากฏในหน้าต่างของแอปพลิเคชันที่ใช้งานอยู่ซึ่งรองรับการป้อนข้อมูล

ข้อสำคัญ: หากต้องการใช้ Speechpad ที่รวมอยู่ในระบบ คุณจะไม่สามารถปิดแท็บเว็บไซต์ในหน้าต่างเบราว์เซอร์ได้ การปิดอันหลังจะเป็นการปิดการป้อนข้อมูลด้วยเสียง

5. ทางเลือกฟรีในการรวมการป้อนข้อมูลด้วยเสียงเข้ากับสภาพแวดล้อม Windows

มีทางเลือกอื่นใดฟรีสำหรับการรวมการป้อนข้อมูลด้วยเสียงภาษารัสเซียเข้ากับสภาพแวดล้อม Windows

ตัวเลือก #1

ไม่มีค่าใช้จ่ายใด ๆ ทั้งสิ้นบนเว็บไซต์ Speechpad.Ru คุณสามารถใช้ตัวเลือกเพื่อส่งออกคำพูดที่รู้จักไปยังคลิปบอร์ด คลิกที่ปุ่ม "เปิดใช้งานการบันทึก" บนเว็บไซต์และไปที่แอปพลิเคชัน Windows ใดก็ได้

ตอนนี้เราสามารถออกเสียงแต่ละวลีและวางจากบัฟเฟอร์ได้โดยใช้ปุ่ม Ctrl+V ทันทีที่เราหยุดคำพูด เราจะได้ยินเสียงแหลมจาก Speechpad ซึ่งระบุว่าวลีดังกล่าวได้รับการยอมรับและคัดลอกไปยังคลิปบอร์ดแล้ว วิธีการทำงานกับการป้อนข้อมูลด้วยเสียงนี้มีข้อดี: เมื่อแทรกแต่ละวลีคุณสามารถแก้ไขข้อความได้ทั้งหมดพร้อมกัน

ตัวเลือกหมายเลข 2

สำหรับผู้ที่ทำงานกับแอปพลิเคชันชุดสำนักงาน Microsoft สามารถเสนอการทำงานในการแนะนำการป้อนข้อมูลด้วยเสียง - Add-in Dictate ซึ่งรวมแท็บเมนูเพิ่มเติมเข้ากับเครื่องมือรู้จำเสียงใน Word, Outlook และ PowerPoint ส่วนเสริมนี้สามารถจดจำคำพูดได้ 20 ภาษา รวมถึงภาษารัสเซีย และช่วยให้คุณสามารถแปลข้อความเป็น 60 ภาษาได้พร้อมกัน

อีกวิธีหนึ่งในการป้อนข้อความด้วยเสียงฟรีคือการบันทึกเสียงพูดลงในไฟล์เสียงพร้อมการถอดเสียงอัตโนมัติเพิ่มเติม (การถอดเสียงเป็นข้อความ) เกือบทุกคนสามารถแสดงความคิดเห็นในภาษาวรรณกรรมที่มีโครงสร้างได้ทันที และในขณะเดียวกันก็แก้ไขข้อผิดพลาดในการรู้จำและเพิ่มเครื่องหมายวรรคตอนได้ เมื่อบันทึกคำพูดด้วยเครื่องบันทึกเสียง คุณสามารถมุ่งความสนใจไปที่แก่นแท้ของเนื้อหาที่นำเสนอได้อย่างเต็มที่ และในกระบวนการถอดความ คุณสามารถมุ่งความสนใจทั้งหมดของคุณไปที่คารมคมคายและการรู้หนังสือในการนำเสนอเนื้อหานี้ แต่เพื่อน ๆ ระบบอัตโนมัติของการถอดเสียงการบันทึกเสียงเป็นหัวข้อสำหรับบทความอื่นที่แยกจากกัน

มีต่อในบทความ:

คุณจะทำอย่างไรหากคุณเบื่อกับการป้อนข้อมูล รันโปรแกรม เขียนอีเมล และทำสิ่งอื่น ๆ บนคอมพิวเตอร์ Windows 8/8.1 ด้วยตนเอง คุณอาจต้องหยุดพักแล้วเริ่มทำงานใหม่อีกครั้ง ในการรู้จำเสียงของ Windows เพื่อช่วยคุณทำสิ่งเหล่านี้ทั้งหมดหรือไม่ การรู้จำเสียงของ Windows ช่วยให้คุณทำทุกอย่างที่คุณสามารถทำได้ด้วยเมาส์และคีย์บอร์ดด้วยเสียงของคุณ และหากคุณกังวลว่าคุณจะพบการรู้จำเสียงใน Windows บนคอมพิวเตอร์ได้จากที่ใด โพสต์นี้จะแสดง 3 วิธีในการเปิดใช้งานการรู้จำเสียงใน Windows และบอกวิธีปิดการใช้งาน

1.สามวิธีในการเปิดใช้งานการรู้จำเสียงใน Windows 8/8.1:

วิธีที่ 1: เปิดการรู้จำเสียงในแผงควบคุม

ขั้นตอนที่ 1: เปิดเมนูทางลัดโดยใช้แป้นพิมพ์ลัด ปุ่ม Windows + Xจากนั้นเลือก แผงควบคุม.

ขั้นตอนที่ 2: ในแผงควบคุม ให้เลือก ความง่ายในการเข้าถึงเพื่อป้อนมัน

ขั้นตอนที่ 3: เมื่อคุณคลิกที่ความง่ายในการเข้าถึง หน้าต่างจะเปิดขึ้น เลือก เปิดตัวการรู้จำเสียงภายใต้ตัวเลือกการรู้จำเสียงพูด

วิธีที่ 2: เปิดการรู้จำคำพูดในหน้าจอ "แอปพลิเคชัน"

ขั้นตอนที่ 1: จากหน้าจอเริ่ม (หรืออินเทอร์เฟซ Metro) ให้คลิกขวาที่ไอคอน หรือ ในพื้นที่ว่างแล้วเลือก แอปพลิเคชันทั้งหมด.

ขั้นตอนที่ 2: บนหน้าจอแอพพลิเคชั่น ให้ค้นหา การรู้จำเสียงของ Windowsและเปิดมันด้วยเมาส์ของคุณ

วิธีที่ 3: เปิดใช้งานผ่านแถบค้นหา

ขั้นตอนที่ 1: เปิดแถบค้นหาโดยใช้การกดแป้นพิมพ์ของคุณ วินโดวส์+เอฟและเข้าไปในช่องที่ว่าง การรู้จำเสียงพูดและเลือกจากรายการค้นหา การใช้งาน .

ขั้นตอนที่ 2: ทางด้านซ้ายของแถบค้นหา เมื่อผลการค้นหาปรากฏขึ้น คุณสามารถเลือกได้ การรู้จำเสียงของ Windows.

2.สองวิธีในการปิดการรู้จำเสียงใน Windows 8/8.1

วิธีที่ 1: เลือก ปุ่มปิดในหน้าต่างการรู้จำเสียงเพื่อปิด

วิธีที่ 2:ใช้กุญแจ Alt+F4เพื่อปิดมัน

ตอนนี้คุณสามารถสำรวจคุณสมบัติการรู้จำเสียงใน Windows 8/8.1 ได้แล้ว

ฉันติดตั้งทั้ง Windows 7 64 และ SpeechPlatformRuntime สำหรับ 64 ในกล่องค้นหา ให้พิมพ์ การรู้จำเสียง จากนั้นกดปุ่มหรือเลือก การรู้จำเสียงของ Windows ฉันมี Windows 7 x64 ทุกอย่างได้รับการติดตั้งในทาสก์บาร์ (ทั้งการรู้จำเสียงพูดและคำพูดของรัสเซีย) แต่ในโปรแกรม "Balabolka" ภาษารัสเซียไม่อยู่ในรายการ (การตั้งค่า>เสียง) คุณยังสามารถเปิดแผงการค้นหาโดยใช้แป้นพิมพ์ของคุณได้โดยกดแป้นโลโก้ Windows+Q

ไฟล์เสียงถูกใช้ในหลายๆ โปรแกรม - โปรแกรมอ่าน นักพูด โปรแกรมสังเคราะห์เสียงพูด ฯลฯ ผู้ชายที่จ่ายค่าค่าโดยสารตะโกนกลับ: ฉันให้มามากเพื่อตัวฉันเองและเพื่อเด็กผู้หญิง! เมื่อดำเนินการคำสั่งคอมพิวเตอร์จะบอกคุณด้วยว่าเป็นเพศอะไร และโดยสรุปอีกสองสามคำเกี่ยวกับไฟล์เสียง

หากต้องการกำหนดข้อความโดยใช้การรู้จำคำพูดของ Windows 8.1

เริ่มต้นด้วยการรู้จำเสียงพูด ตามที่นักจิตวิทยา การรับรู้คำพูดเป็นหนึ่งในอาการลึกลับที่สุดของสติปัญญาของมนุษย์ ยังไม่ชัดเจนว่าเด็ก ๆ เรียนรู้ที่จะเข้าใจภาษาพูดและพูดได้อย่างไร ปัญหาของการรู้จำคำพูดของเครื่องได้ดึงดูดความสนใจของผู้เชี่ยวชาญในสาขาวิทยาการคอมพิวเตอร์มาเป็นเวลานาน อย่างไรก็ตาม จนถึงขณะนี้ เรามีความก้าวหน้าค่อนข้างน้อยในทิศทางนี้

ประการแรก บุคคลมักจะไม่หยุดระหว่างคำ และเมื่อออกเสียงอย่างต่อเนื่อง งานในการจดจำคำก็ถูกเพิ่มเข้าไปในงานแยกคำออกจากกระแสคำพูด ซึ่งเห็นได้ชัดว่ายากกว่า เป็นเพราะปัญหาเหล่านี้และปัญหาอื่น ๆ อีกมากมายที่ยังห่างไกลจากการแก้ปัญหาการรู้จำเสียงอย่างสมบูรณ์ มีโหมดการทำงานที่แตกต่างกันสองโหมดอย่างมีนัยสำคัญ: ด้วยการจูนตามเสียงของบุคคลใดบุคคลหนึ่งและไม่มีการปรับจูนดังกล่าว

ขั้นตอนการปรับเสียงมีดังนี้: บุคคลอ่านข้อความที่เรียบเรียงเป็นพิเศษ คอมพิวเตอร์จดจำคำและให้ตัวเลือกการจดจำแก่บุคคลนั้น นี่แนะให้ใช้รูปแบบคำพูดของมนุษย์เพื่อสร้างระบบรักษาความปลอดภัยต่างๆ

การใช้การรู้จำเสียง

วิธีฝึกคอมพิวเตอร์ให้จดจำคำพูด

ตัวอย่างเช่น บอร์ดรู้จำเสียงพูด VR/160 มาตรฐานที่ผลิตโดย Dialogic สามารถ "ให้บริการ" ได้สูงสุด 16 ช่องพร้อมกัน ในขณะที่ความสามารถของ VRSoft นั้นจำกัดอยู่ที่สี่ช่องสัญญาณ ในระบบโทรศัพท์คอมพิวเตอร์ จะใช้โหมดการรู้จำเสียงทั้งสามโหมด การรู้จำคำพูดที่ปรับด้วยเสียงจะใช้ในระบบต่างๆ ที่มีโฮสต์เฉพาะ

การพัฒนา →ค้นหาระบบรู้จำเสียงพูดที่เหมาะสมที่สุดด้วยซอร์สโค้ดแบบปิด แต่มี API แบบเปิดสำหรับการบูรณาการ

ระบบเสียงรักษาความปลอดภัยซึ่งใช้รูปแบบน้ำเสียงของคำพูดเป็นรหัสผ่าน ถูกนำมาใช้เพื่อป้องกันการเข้าถึงข้อมูลโดยไม่ได้รับอนุญาต พจนานุกรมเหล่านี้สร้างขึ้นสำหรับหลายภาษาตั้งแต่ภาษาอังกฤษ (ที่มีสำเนียงต่างกัน) ไปจนถึงภาษาฮิบรูและญี่ปุ่น แต่ยังไม่สามารถทำงานกับภาษารัสเซียในโหมดนี้ได้

พจนานุกรมสำหรับการรู้จำคำพูดอย่างต่อเนื่องมีให้บริการเฉพาะบางภาษาเท่านั้น ได้แก่ อังกฤษ ฝรั่งเศส เยอรมัน สเปน เกาหลี และอีกสองสามภาษา อีกตัวอย่างหนึ่งของระบบที่ทำงานร่วมกับการรู้จำเสียงในภาษารัสเซียก็คือระบบการคัดเลือกบุคลากร ซึ่งเป็นผลิตภัณฑ์ของบริษัท Artix

การแปลเสียงเป็นข้อความ

ระบบรับรู้หมายเลขที่พูดและเข้าสู่ฐานข้อมูล การดำเนินการผกผันกับการรู้จำเสียงคือการแปลงข้อความเป็นคำพูด นี่คือชื่อของเทคโนโลยีที่ช่วยให้คุณสามารถสร้างคำพูดจากข้อความได้ อุปกรณ์คอมพิวเตอร์ใดๆ สำหรับการสร้างเสียงพูดแบบดิจิทัลสามารถใช้เป็นฐานฮาร์ดแวร์สำหรับการนำระบบดังกล่าวไปใช้ โดยเฉพาะ Sound Blaster เหมาะสำหรับสิ่งนี้

เสียงภาษารัสเซียสำหรับ Windows

อย่างไรก็ตามเมื่อเร็ว ๆ นี้โปรแกรมที่ใช้เทคนิคสากลที่ทรงพลังกว่ามากในการสังเคราะห์ข้อความเสียงจากข้อความที่กำหนดเองได้แพร่หลายมากขึ้น ปัจจุบัน มีสองวิธีโดยพื้นฐานที่แตกต่างกันในการสร้างแบบจำลองคำพูดของมนุษย์ ประการแรกเกี่ยวข้องกับการสร้างแบบจำลองสัญญาณเสียงจริง ประการที่สอง (ซึ่งอาจยากกว่านั้น) จำเป็นต้อง "เตรียม" คำพูดเทียมด้วยน้ำเสียงที่เป็นธรรมชาติและเน้นย้ำในคำพูด

วิธีเปิดใช้งาน Cortana บน Windows 10 ในรัสเซีย

แน่นอนว่าระบบนี้ใช้ได้กับภาษาอังกฤษเท่านั้น นอกจากนี้ เนื่องจากเรากำลังพูดถึงการสื่อสารผ่านอินเทอร์เน็ต การสนทนาจึงเกิดการหยุดชะงักเพียงเสี้ยววินาทีอย่างหลีกเลี่ยงไม่ได้ เหมือนกับการใช้โทรศัพท์ผ่านดาวเทียม

ฟิลด์ระดับการรู้จำจะแสดงคุณภาพของการรู้จำเสียงหรือประเภทของข้อผิดพลาด หากมี ก่อนที่คุณจะสามารถใช้การรู้จำเสียงได้ คุณต้องดำเนินการหลายขั้นตอนก่อน

ก่อนตั้งค่าการรู้จำเสียง ตรวจสอบให้แน่ใจว่าไมโครโฟนเชื่อมต่อกับคอมพิวเตอร์แล้ว การรู้จำเสียงใช้โปรไฟล์พิเศษเพื่อจดจำคำสั่งเสียงและคำสั่งเสียงของคุณ ยิ่งคุณใช้การรู้จำคำพูดมากเท่าไร โปรไฟล์คำสั่งเสียงของคุณก็จะยิ่งมีรายละเอียดมากขึ้นเท่านั้น ช่วยให้คอมพิวเตอร์เข้าใจคุณได้ดีขึ้น ทำตามคำแนะนำในขณะที่คุณเรียนรู้การจดจำเสียง

เพื่อเพิ่มหรือเปลี่ยนคำในพจนานุกรม

คุณสมบัตินี้ช่วยให้คุณมั่นใจได้ว่าคำสั่งของคุณได้รับการยอมรับจากระบบและพร้อมที่จะดำเนินการ ไลบรารีการรู้จำคำสั่งเสียงของ VoiceCom เป็นแกนหลักของโปรแกรม VoiceNavigator และ Truffaldino ที่อธิบายไว้ข้างต้น ในกรณีนี้ การเชื่อมต่อระหว่างข้อความและเสียงพูดจะถูกสร้างขึ้นโดยอัตโนมัติ และแม้ว่าจะไม่อนุญาตให้คุณทำงานนี้โดยไม่ต้องใช้แป้นพิมพ์และเมาส์ แต่การใช้งานยังคงสามารถเพิ่มความเร็วในการพิมพ์ได้โดยเฉพาะสำหรับผู้พิการ

ระบบจะทำการจดจำในเบื้องหลัง คุณสามารถเน้นส่วนของข้อความโดยใช้เสียงของคุณ คุณจะพบตัวอย่างอื่นๆ ในเอกสารประกอบสำหรับแพ็คเกจ Microsoft Office XP และในระบบวิธีใช้ นี่คือเครื่องถอดเสียงคอมพิวเตอร์ เช่นเดียวกับระบบ Nestor และ Allegro Evernote จะไม่แปลงการบันทึกเสียงเป็นข้อความ และไม่อนุญาตให้คุณค้นหาบันทึกเสียงตามคำในการบันทึก อุปกรณ์สมัยใหม่ส่วนใหญ่รองรับการแปลงคำพูดเป็นข้อความหากคุณเปิดใช้งานคุณสมบัตินี้

ด้วยการรู้จำเสียงใน Windows ไม่จำเป็นต้องใช้แป้นพิมพ์และเมาส์ ในตัวเลือกการรู้จำภาษา ให้เลือกภาษาอังกฤษ เครื่องมือรู้จำเสียงที่มาพร้อมกับ Microsoft Office XP สามารถใช้ได้กับแอปพลิเคชันทั้งหมดในชุด เช่น Microsoft Word, Microsoft Excel เป็นต้น ตามกฎแล้วเทคนิคนี้มีความหมายเมื่อพูดถึงการแปลงข้อความเป็นคำพูด