Ứng dụng Windows của Speechify sử dụng các mô hình cục bộ để phiên âm và đọc chính tả

Ứng dụng Windows của Speechify sử dụng các mô hình cục bộ để phiên âm và đọc chính tả

Công ty Voice AI Speechify vừa ra mắt một ứng dụng Windows gốc sử dụng các mô hình được lưu trữ cục bộ để cho phép đọc chính tả trên các ứng dụng và đọc to các bài báo, tài liệu hoặc tệp PDF bằng thư viện giọng nói của nó.

Image Credits: Speechify
Image Credits: Speechify

Công ty đang cạnh tranh với Wispr Flow, Willow và Superwhisper, những công ty cũng cung cấp ứng dụng đọc chính tả và phiên âm trên nhiều nền tảng.

Speechify cho biết ứng dụng Windows xử lý giọng nói hoàn toàn trên thiết bị trên PC Copilot + (có NPU của AMD, Intel và Qualcomm) và các PC Windows 11 khác có GPU của Intel và AMD.

Ứng dụng này có ba mô hình chạy trên thiết bị: chuyển văn bản thành giọng nói thần kinh, phát hiện hoạt động giọng nói theo thời gian thực và phiên âm được hỗ trợ bởi Whisper.

Người dùng có thể định cấu hình ứng dụng để chuyển sang các mô hình dựa trên đám mây hoặc thậm chí thay đổi chúng trong quá trình sử dụng.

Công ty có hơn 50 triệu người dùng cho biết VITS Neural có thể tạo ra âm thanh trên bảy cài đặt trước tốc độ khác nhau, cho phép người dùng yêu cầu ứng dụng đọc to tài liệu hoặc trang web.

Công ty sử dụng mô hình nguồn mở Silero để phát hiện hoạt động giọng nói.

“Hơn một tỷ người trên hành tinh này sử dụng Windows.

Ảnh minh họa

Với lần ra mắt Windows này, chúng tôi đảm bảo rằng việc đọc và giờ đây là viết không bao giờ là rào cản, bất kể bạn sử dụng thiết bị nào hay cách bạn thích làm việc.

Chúng tôi đặc biệt vui mừng về cơ hội trong doanh nghiệp khi có rất nhiều chuyên gia đã yêu cầu Speechify trên PC của họ,” Cliff Weitzman, người sáng lập và Giám đốc điều hành của Speechify, cho biết trong một tuyên bố.

Tháng trước, công ty đã ra mắt phiên bản cuộc họp giống Granola, nhưng tính năng đó chỉ giới hạn ở các cuộc họp dựa trên trình duyệt.

Giờ đây, công ty có ứng dụng trên nhiều nền tảng, có thể họ sẽ đưa tính năng này vào các ứng dụng gốc để ghi lại cuộc họp trên bất kỳ ứng dụng hoặc trình duyệt nào.

Cho đến vài năm trước, Speechify chủ yếu tập trung vào các trường hợp sử dụng chuyển văn bản thành giọng nói như đọc các bài báo và email cũng như tạo tài liệu podcast.

Gần đây, công ty đang cố gắng trở thành một ứng dụng giọng nói đầy đủ cho người dùng bằng cách tung ra tính năng đọc chính tả, phiên âm cuộc họp và trợ lý giọng nói.

StrictlyVC khởi động năm mới ở SF.

Ảnh minh họa
Ethan Agarwal, Aaptiv, on Centre Stage during day three of Collision 2019 at Enercare Center in Toronto, Canada.
Tôi là một lập trình viên IOS. Code chính là IOS nhưng thỉnnh thoảng vẫn đá sang Android hoặc web. Mặc dù không quá thông thạo nhưng tôi sẽ chia sẻ những kiến thức mà mình đã tìm hiểu, áp dụng qua.

Bài viết liên quan

Định giá của Whoop vừa tăng gấp ba lên 10 tỷ USD

Whoop, công ty thiết bị đeo theo dõi sức khỏe và thể dục, đã kết thúc vòng tài trợ Series G trị giá 575 triệu USD với mức định giá 10,1 tỷ USD – gần gấp ba lần mức định giá được báo cáo gần đây nhất là 3,6 tỷ USD – trong một thỏa thuận tập hợp các quỹ tài sản có chủ quyền, các tổ chức y tế lớn và một số vận động viên nổi tiếng nhất thế giới.

Xem thêm

Áp dụng luật khuyến khích cá nhân nước ngoài chuyển giao công nghệ vào Việt Nam

Luật sửa đổi được Quốc hội thông qua từ tháng 12/2025 và có hiệu lực hôm nay, bổ sung nhiều cơ chế mới nhằm thúc đẩy đổi mới sáng tạo và kiểm soát công nghệ, đồng thời bãi bỏ những quy định không còn phù hợp. Đây là lần sửa đổi, bổ sung lớn cho Luật Chuyển giao công nghệ ra đời năm 2017.

Xem thêm

Tất cả người dùng Google ở ​​Hoa Kỳ hiện có thể thay đổi địa chỉ Gmail của họ

Tính đến ngày 1 tháng 4, Gmail sẽ hoạt động được 22 năm.

Xem thêm
0 0 đánh giá
Article Rating
Theo dõi
Thông báo của
guest
0 Comments
Cũ nhất
Mới nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận