Ứng dụng Windows của Speechify sử dụng các mô hình cục bộ để phiên âm và đọc chính tả

Ứng dụng Windows của Speechify sử dụng các mô hình cục bộ để phiên âm và đọc chính tả

Công ty Voice AI Speechify vừa ra mắt một ứng dụng Windows gốc sử dụng các mô hình được lưu trữ cục bộ để cho phép đọc chính tả trên các ứng dụng và đọc to các bài báo, tài liệu hoặc tệp PDF bằng thư viện giọng nói của nó.

Image Credits: Speechify
Image Credits: Speechify

Công ty đang cạnh tranh với Wispr Flow, Willow và Superwhisper, những công ty cũng cung cấp ứng dụng đọc chính tả và phiên âm trên nhiều nền tảng.

Speechify cho biết ứng dụng Windows xử lý giọng nói hoàn toàn trên thiết bị trên PC Copilot + (có NPU của AMD, Intel và Qualcomm) và các PC Windows 11 khác có GPU của Intel và AMD.

Ứng dụng này có ba mô hình chạy trên thiết bị: chuyển văn bản thành giọng nói thần kinh, phát hiện hoạt động giọng nói theo thời gian thực và phiên âm được hỗ trợ bởi Whisper.

Người dùng có thể định cấu hình ứng dụng để chuyển sang các mô hình dựa trên đám mây hoặc thậm chí thay đổi chúng trong quá trình sử dụng.

Công ty có hơn 50 triệu người dùng cho biết VITS Neural có thể tạo ra âm thanh trên bảy cài đặt trước tốc độ khác nhau, cho phép người dùng yêu cầu ứng dụng đọc to tài liệu hoặc trang web.

Công ty sử dụng mô hình nguồn mở Silero để phát hiện hoạt động giọng nói.

“Hơn một tỷ người trên hành tinh này sử dụng Windows.

Ảnh minh họa

Với lần ra mắt Windows này, chúng tôi đảm bảo rằng việc đọc và giờ đây là viết không bao giờ là rào cản, bất kể bạn sử dụng thiết bị nào hay cách bạn thích làm việc.

Chúng tôi đặc biệt vui mừng về cơ hội trong doanh nghiệp khi có rất nhiều chuyên gia đã yêu cầu Speechify trên PC của họ,” Cliff Weitzman, người sáng lập và Giám đốc điều hành của Speechify, cho biết trong một tuyên bố.

Tháng trước, công ty đã ra mắt phiên bản cuộc họp giống Granola, nhưng tính năng đó chỉ giới hạn ở các cuộc họp dựa trên trình duyệt.

Giờ đây, công ty có ứng dụng trên nhiều nền tảng, có thể họ sẽ đưa tính năng này vào các ứng dụng gốc để ghi lại cuộc họp trên bất kỳ ứng dụng hoặc trình duyệt nào.

Cho đến vài năm trước, Speechify chủ yếu tập trung vào các trường hợp sử dụng chuyển văn bản thành giọng nói như đọc các bài báo và email cũng như tạo tài liệu podcast.

Gần đây, công ty đang cố gắng trở thành một ứng dụng giọng nói đầy đủ cho người dùng bằng cách tung ra tính năng đọc chính tả, phiên âm cuộc họp và trợ lý giọng nói.

StrictlyVC khởi động năm mới ở SF.

Ảnh minh họa
Ethan Agarwal, Aaptiv, on Centre Stage during day three of Collision 2019 at Enercare Center in Toronto, Canada.
Tôi là một lập trình viên IOS. Code chính là IOS nhưng thỉnnh thoảng vẫn đá sang Android hoặc web. Mặc dù không quá thông thạo nhưng tôi sẽ chia sẻ những kiến thức mà mình đã tìm hiểu, áp dụng qua.

Bài viết liên quan

Delta chọn Amazon Leo cho Wi-Fi trên chuyến bay bắt đầu từ năm 2028

Hai công ty đã công bố Wi-Fi trên chuyến bay trên các chuyến bay của Delta sẽ được cung cấp bởi Amazon Leo bắt đầu từ năm 2028.

Xem thêm

Rec Room, một trò chơi VR theo phong cách Roblox, sắp ngừng hoạt động

Rec Room tựa game VR giống Roblox sắp ngừng hoạt động sau khi hoạt động được một thập kỷ.

Xem thêm

DoorDash hợp tác với Rivian spinoff Cũng dành cho các phương tiện giao hàng tự động

Các kế hoạch phân phối tự động của DoorDash cũng sẽ nhận được sự hỗ trợ từ phần phụ Rivian.

Xem thêm
0 0 đánh giá
Article Rating
Theo dõi
Thông báo của
guest
0 Comments
Cũ nhất
Mới nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận