Hướng dẫn

Nhận dạng giọng nói: Suy nghĩ về điểm mạnh và điểm yếu của nó

Tôi phải thừa nhận rằng tôi đã không sử dụng bất kỳ loại nhận dạng giọng nói trong một thời gian dài khi tôi được yêu cầu làm các hướng dẫn. Lần cuối cùng tôi đã thử nhận dạng giọng nói, đó là với Dragon Dictate, cái mới khi Windows 98 cũng mới. Một thời gian rất dài trước đây trong những năm máy tính!

Tôi rất vui khi giải quyết vấn đề này bởi vì tôi rất quan tâm để xem cách nhận dạng giọng nói đã được cải thiện như thế nào. Và cậu bé, nó đã được cải thiện! Ngay cả một ứng dụng cơ bản, tích hợp như thế này đã làm một công việc đáng kinh ngạc "ngay bên ngoài hộp." Trong bài viết cuối cùng về nhận dạng giọng nói, tôi muốn nói về những gì tôi đã học được trong khi tự phản ứng lại với những kỳ quan về nhận dạng giọng nói, và tôi sẽ đi đâu từ đây.

Chưa sẵn sàng cho Star Trek

Tôi chắc rằng nhiều người trong chúng ta đã xem phi hành đoàn của hãng tàu vũ trụ Starship Enterprise nói "Máy tính!" và nhận được câu trả lời ngay lập tức. Chúng tôi chưa có máy tính Starfleet, nhưng bắt đầu với Windows Vista và tiếp tục trong Windows 7, chúng tôi có máy tính sẽ lắng nghe chúng tôi và trả lời những gì chúng tôi nói với họ - và trả lời chúng tôi, nếu "Cái gì vậy?" được coi là một câu trả lời.

Tôi đã có vấn đề khi lần đầu tiên tôi cố gắng sử dụng Speech Recognition, và xử lý sự cố không phải là đặc biệt đơn giản. Các tệp trợ giúp không phải lúc nào cũng đủ hữu ích. Tôi đã có thể tìm thấy câu trả lời trên trang web của Microsoft và trong một loạt các diễn đàn trực tuyến mà không có quá nhiều công việc. Đó là cách tôi phát hiện ra rằng tôi đã quên rằng webcam của tôi (ngồi ngay trước mặt tôi trên màn hình của tôi, và trực tiếp phù hợp với cách tôi đang nói) cũng có một microphone hoạt động và đang thêm vào sự nhầm lẫn. Một khi tôi sửa nó, nó đã được khá trơn tru thuyền từ đó về sau.

Tôi thậm chí đã cố gắng nói chuyện với một loại giọng khác nhau (BBC Anh và Mỹ redneck, ví dụ) và đã có thể nhận được sự công nhận hợp lý tốt, cho phép sự khác biệt trong cách phát âm tiêu chuẩn của Mỹ. Tất nhiên, nói rằng "Bạn bè, người La Mã, đồng hương, cho tôi mượn đôi tai của bạn!" trong khi thực hiện những ấn tượng tốt nhất của tôi về Helen Mirren và Jeff Foxworthy đã khiến tôi cười quá nhiều để có được kết quả hoàn toàn chính xác.

Nhận dạng ngôn ngữ

Nhận dạng giọng nói có thể được sử dụng với các ngôn ngữ khác nhau, và tôi nghĩ tôi có thể dùng thử với tiếng Mỹ, tiếng Tây Ban Nha, tiếng Đức và tiếng Pháp có giới hạn, nhưng tiếc là bạn không thể sử dụng các ngôn ngữ khác trừ khi hệ điều hành của bạn cũng bằng ngôn ngữ đó. Bạn có thể thay đổi ngôn ngữ của hệ điều hành bằng cách cài đặt gói ngôn ngữ khác từ Microsoft, nhưng bạn chỉ có thể làm điều đó nếu bạn đang chạy Windows 7 Ultimate hoặc Windows 7 Enterprise.

Nhận dạng giọng nói có sẵn cho tiếng Anh Mỹ, Anh Anh, Pháp, Tây Ban Nha, Đức, Nhật, Trung Quốc truyền thống và tiếng Hoa giản thể và sẽ được tìm thấy trong các phiên bản Windows 7 (tất cả các phiên bản) của ngôn ngữ đó. Tôi xin lỗi vì không thể thử điều đó. Tôi không biết điều gì sẽ xảy ra với Windows 8, nhưng tôi nghĩ khả năng cài đặt các gói ngôn ngữ khác sẽ là một bổ sung tốt cho Windows 8 tương đương Windows 7 Professional và cao hơn.

Những gì hoạt động tốt

Như tôi đã đề cập, Nhận dạng giọng nói được thiết kế để hoạt động tốt nhất với phần mềm Microsoft khác. Miễn là tôi đã thử nghiệm với các sản phẩm của Microsoft, tôi đã rất thành công (mặc dù người ta có thể mong đợi, sử dụng Microsoft Office Excel vừa bị giới hạn vừa phức tạp). Với các phần mềm khác, nó bị đánh hoặc bỏ lỡ. Tôi có thể sử dụng trình duyệt Google Chrome khá tốt (chắc chắn cũng không phải là Internet Explorer ) và chương trình email Eudora của tôi, vốn là một phần mềm cổ xưa. Bạn nên thử nghiệm với phần mềm yêu thích của riêng mình để xem bạn có thể làm gì. Lệnh "hiển thị số" đặc biệt hữu ích trong việc chọn các mục và lệnh.

Tôi cũng thấy rằng nó không mất nhiều thời gian để tính chính xác của sự công nhận để cải thiện rõ rệt. Tôi đã đi qua các bài tập huấn luyện hai lần, và sau đó sự công nhận là gần như chính xác 100%. Tôi đã có thể nói nhanh hơn một chút và tạm dừng ít hơn cho phần mềm để theo kịp. Tôi thực sự rất thích xem giọng nói của tôi được dịch thành những từ trên màn hình. Những kinh nghiệm ban đầu của tôi với phần mềm nhận dạng giọng nói không ở đâu gần đây.

Những gì không hoạt động tốt

Như tôi đã đề cập, một số phần mềm không tương thích với Nhận dạng giọng nói . Tôi thậm chí không thể mở Adobe Reader hoặc phiên bản Adobe AIR của TweetDeck . Tôi thấy rằng tôi không thể đăng nhập vào tài khoản Google của mình bằng Internet Explorer để dùng thử Google Documents —có vẻ như không có cách nào để nói hoặc đánh vần mật khẩu của tôi. Tôi nghi ngờ đây là vấn đề bảo mật, không cho phép mật khẩu được nói to lên nơi người khác có thể nghe thấy, nhưng điều đó thật khó chịu.

Tôi có thể mở iTunes và chọn một bài hát để chơi, nhưng thực sự không thể phát nó. Tôi có thể mở Scrivener (bộ xử lý văn bản của tôi lựa chọn) nhưng "Hiển thị số" không che phủ số trên bất cứ điều gì tôi muốn sử dụng. Tôi đã không thực hiện bất kỳ thử nghiệm thực sự mở rộng nào với phần mềm yêu thích của tôi - đó chỉ là một vài thử nghiệm mà tôi đã thử. Nó sẽ là giá trị cho bất cứ ai muốn sử dụng Speech Recognition để kiểm tra các chương trình mà họ muốn sử dụng nó với, để chắc chắn nó sẽ tương thích.

Các liên kết và tài nguyên khác

Nếu bạn chưa từng thấy các bài viết trước, bạn có thể tìm thấy chúng tại đây:

  • Làm việc với nhận dạng giọng nói: Thiết lập và cấu hình
  • Làm việc với nhận dạng giọng nói: Lệnh, đọc chính tả văn bản và duyệt web
  • Gỡ rối các vấn đề nhận dạng giọng nói chung

Thật kỳ lạ, hầu như không thể tìm thấy bất kỳ thông tin nào về Nhận dạng giọng nói trên trang web của Microsoft Answers mà không cần nhấp vào liên kết từ tìm kiếm Google hoặc Bing. Tôi đã không thể nhận được bất kỳ câu trả lời nào cả bằng cách đặt "Speech Recognition" vào hộp tìm kiếm, mặc dù có một số câu hỏi về nó trong các diễn đàn. Sử dụng liên kết này để nhận trợ giúp Nhận dạng giọng nói từ trang web Windows: Kết quả tìm kiếm bằng giọng nói.

Dưới đây là một bài viết ngắn gọn về Wikipedia về lịch sử nhận dạng giọng nói tại Microsoft: Windows Speech Recognition.

Đây là một mục blog cung cấp cho những suy nghĩ của tác giả về việc so sánh Speech Recognition với Dragon Naturally Speaking: Dragon NaturallySpeaking so với Windows 7 Voice Recognition.

Gói nó lên

Tôi thực sự rất thích làm việc với Speech Recognition và ngạc nhiên trước những cải tiến đã được thực hiện theo thời gian. Nó chắc chắn sẽ đủ tốt để sử dụng hàng ngày, đặc biệt là với các sản phẩm của Microsoft.

Tôi có tiếp tục sử dụng Speech Recognition không? Có, khi tôi có thể. Tại thời điểm này tôi không cần bất cứ điều gì phức tạp hơn. Đó là cũng có giá trị thời gian cần để đào tạo nó và đào tạo bản thân mình để sử dụng nó đúng.