Ứng dụng Windows của Speechify sử dụng các mô hình cục bộ để phiên âm và đọc chính tả

Ứng dụng Windows của Speechify sử dụng các mô hình cục bộ để phiên âm và đọc chính tả

Công ty Voice AI Speechify vừa ra mắt một ứng dụng Windows gốc sử dụng các mô hình được lưu trữ cục bộ để cho phép đọc chính tả trên các ứng dụng và đọc to các bài báo, tài liệu hoặc tệp PDF bằng thư viện giọng nói của nó.

Công ty đang cạnh tranh với Wispr Flow, Willow và Superwhisper, những công ty cũng cung cấp ứng dụng đọc chính tả và phiên âm trên nhiều nền tảng.

Speechify cho biết ứng dụng Windows xử lý giọng nói hoàn toàn trên thiết bị trên PC Copilot + (có NPU của AMD, Intel và Qualcomm) và các PC Windows 11 khác có GPU của Intel và AMD.

Ứng dụng này có ba mô hình chạy trên thiết bị: chuyển văn bản thành giọng nói thần kinh, phát hiện hoạt động giọng nói theo thời gian thực và phiên âm được hỗ trợ bởi Whisper.

Người dùng có thể định cấu hình ứng dụng để chuyển sang các mô hình dựa trên đám mây hoặc thậm chí thay đổi chúng trong quá trình sử dụng.

Công ty có hơn 50 triệu người dùng cho biết VITS Neural có thể tạo ra âm thanh trên bảy cài đặt trước tốc độ khác nhau, cho phép người dùng yêu cầu ứng dụng đọc to tài liệu hoặc trang web.

Công ty sử dụng mô hình nguồn mở Silero để phát hiện hoạt động giọng nói.

“Hơn một tỷ người trên hành tinh này sử dụng Windows.

Với lần ra mắt Windows này, chúng tôi đảm bảo rằng việc đọc và giờ đây là viết không bao giờ là rào cản, bất kể bạn sử dụng thiết bị nào hay cách bạn thích làm việc.

Chúng tôi đặc biệt vui mừng về cơ hội trong doanh nghiệp khi có rất nhiều chuyên gia đã yêu cầu Speechify trên PC của họ,” Cliff Weitzman, người sáng lập và Giám đốc điều hành của Speechify, cho biết trong một tuyên bố.

Tháng trước, công ty đã ra mắt phiên bản cuộc họp giống Granola, nhưng tính năng đó chỉ giới hạn ở các cuộc họp dựa trên trình duyệt.

Giờ đây, công ty có ứng dụng trên nhiều nền tảng, có thể họ sẽ đưa tính năng này vào các ứng dụng gốc để ghi lại cuộc họp trên bất kỳ ứng dụng hoặc trình duyệt nào.

Cho đến vài năm trước, Speechify chủ yếu tập trung vào các trường hợp sử dụng chuyển văn bản thành giọng nói như đọc các bài báo và email cũng như tạo tài liệu podcast.

Gần đây, công ty đang cố gắng trở thành một ứng dụng giọng nói đầy đủ cho người dùng bằng cách tung ra tính năng đọc chính tả, phiên âm cuộc họp và trợ lý giọng nói.

StrictlyVC khởi động năm mới ở SF.