Các hãng VoiceSignal và Nuance đều phát triển thành công các phần mềm hỗ trợ gọi điện, soạn SMS, tìm kiếm và "chat" bằng giọng nói thay vì sử dụng bàn phím và giao diện điều khiển nhỏ bé. Cả hai đang xúc tiến việc tìm kiếm đối tác để đưa các phần mềm này ra thị trường.
Đó là hệ thống nhận dạng giọng nói trợ giúp cho việc soạn văn bản, tìm kiếm và xử lý một số chức năng khác mà không cần dùng bàn phím tới hay lệ thuộc các trình duyệt có giao diện nhỏ bé, khó nhìn.
Ý tưởng phía sau các hệ thống phần mềm nói trên là xây dựng khả năng nhận dạng tốt hơn các giọng nói thông thường và làm giàu vốn từ vựng hơn hẳn trước đây. Người dùng có thể ra lệnh cho máy ở tốc độ phát âm thông thường và các âm từ phát ra sẽ được phần mềm trong máy chuyển ngay thành dạng text, và vẫn cho phép người dùng kiểm tra và sửa lại nếu cần thiết, hai hãng này cho biết.
VoiceMode 2.0
Phần mềm VoiceMode 2.0 của hãng VoiceSignal thực sự là bước tiến dài so với phiên bản đầu tiên, theo Chủ tịch hãng này, ông Rich Geruson cho biết. Ở phiên bản đầu, người dùng phải phát âm chậm rãi từng từ một để máy ghi lại. Tuy nhiên, phiên bản 2.0 cho phép người dùng cầm máy lên ra lệnh cho máy thực hiện các công việc thường thức như gửi tin nhắn, bấm số gọi điện chỉ bằng giọng nói mà không cần bấm vào bàn phím, theo ông Geruson.
Công nghệ này sẽ nhận dạng các thành phần của từ, còn gọi là nguyên âm và phụ âm, nên máy có thể nghe thấy ta phát âm mà xây dựng cấu trúc từ chứ không hề hiểu ngữ nghĩa. Phiên bản mới được mở rộng sang các thể loại ngôn ngữ bao gồm: Anh-Anh, Anh-Mỹ và một số ngôn ngữ khác ở châu Âu, hãng VoiceSignal cho biết.
Một hãng sản xuất điện thoại di động đã quyết định ứng dụng VoiceMode 2.0 vào một mẫu sản phẩm sẽ được tung ra thị trường vào quý III tới, và mẫu điện thoại này sẽ đến châu Âu trước tiên, theo hãng VoiceSignal.
Ngoài ra, hãng VoiceSignal còn giới thiệu đến người dùng tính năng, VSearch, một công cụ tìm kiếm trên Internet bằng cách ra lệnh bằng giọng nói. Phần mềm cũng chuyển cụm từ cần tìm kiếm được phát âm thành dạng text và nhập thẳng tới server, sau đó hiện ra kết quả tìm kiếm được trên màn hình, Chủ tịch Geruson giải thích. Nếu kết quả tìm kiếm là một chuỗi số điện thoại, bạn có thể lấy một đáp án trong các kết quả tìm kiếm đó, đọc lên và yêu cầu máy quay luôn để đàm thoại.
VSearch có thể thích nghi làm việc với nhiều công cụ tìm kiếm khác nhau, theo ông Geruson. VoiceSignal đang đàm phán với các công ty cung cấp công cụ tìm kiếm trên Internet để phối hợp đưa vào các mẫu điện thoại di động tương lai.
Nuance cùng chí hướng
Hãng Nuance từng có những sản phẩm nhận dạng giọng nói dành cho máy tính để bàn giờ đây bước sang thế giới điện thoại di động với chi nhánh có tên gọi Nuance Mobile. Bộ phận này có kế hoạch tung ra một chương trình dành cho các máy điện thoại cầm tay tung ra ở Anh trong năm nay, có tên gọi Dragon Mobile Dictation. Phần mềm này hỗ trợ ra lệnh bằng giọng nói với cách phát âm liên tục và vốn từ vựng phong phú, đảm bảo "tốc ký" lại chính xác những ngôn từ khổ biến thường dùng trong soạn SMS, ông Mike Thompson, phó chủ tịch kiêm tổng giám đốc bộ phận dịch vụ phần mềm viễn thông của Nuance cho biết.
Giống như hệ thống của VoiceSignal, Dragon Mobile Dictation thích hợp dành cho máy điện thoại cầm tay. Hãng cũng có kế hoạch hỗ trợ tìm kiếm và "chat" IM bằng giọng nói. Phần mềm cũng sẽ được hỗ trợ trên các hệ thống mạng chủ/khách và nguyên lý nhận dạng giọng nói chuyển qua mạng, theo Phó chủ tịch Thompson.
Cũng tại triển lãm không dây CTIA tuần qua, hãng Nuance đã tung ra một phần mềm điều khiển tính năng chơi nhạc MP3 trên máy điện thoại di động. Phần mềm này do hãng và công ty thông tin âm nhạc GraceNote hợp tác phát triển. Phần mềm sẽ cho phép người dùng gọi tên ca sỹ và tựa đề bài hát muốn nghe để máy tự động chấp hành thậm chí là đọc lên một số đặc điểm đặc biệt của bài hát cần nghe với điều kiện bài đó có trong danh mục và một bản liệt kê các hình thức gọi ra bài hát tự động. Nuance đang tìm kiếm đối tác sản xuất điện thoại di động để đưa giao diện điều khiển chơi nhạc thú vị này vào thực tiễn.
Thiếu tính thuyết phục
Tuy nhiên, một nhà phân tích mạng không dây, ông Eddie Hold không tin rằng giao diện nhận dạng bằng giọng nói trên máy điện thoại di động sẽ được chuộng. Các công cụ giúp thiết lập cuộc gọi và soạn SMS, IM, tìm kiếm bằng giọng nói quả nhiên rất thú vị nhưng khó được đại đa số người dùng chấp nhận vì tính bảo mật không còn được đảm bảo. Chưa kể việc đọc lên sẽ làm phiền cho người khác và việc phát âm cũng chưa phải là chuẩn xác dẫn đến việc người dùng vẫn lệ thuộc vào bàn phím số. Sửa bản SMS do máy nghe và soạn có khi lại lâu không kém gì tự thao tác bằng bàn phím, theo ông Hold.
Chưa kể, ngày nay việc duyệt web trên điện thoại di động ngày càng dễ dàng. Chẳng hạn, hãng AOL đang giới thiệu dịch vụ web thích nghi với màn hình nhỏ của "dế" tại CTIA 2006. Dịch vụ duyệt web cho dế của AOL được phát triển dựa trên công nghệ phân tích nội dụng và mã hoá của hãng InfoGin, đảm bảo tích hợp sẵn công cụ tìm kiếm dành cho máy cầm tay AOL Search , công ty này cho biết. AOL đã bắt tay với Sprint Nextel để cung cấp dịch vụ này trên mạng điện thoại di động của Sprint.
(Theo PC World)