Tổng quan
API chuyển ngữ Salad giúp các nhóm chuyển đổi khối lượng lớn phương tiện truyền thông thành những bản ghi chính xác, chú giải hoặc phụ đề.
Chuyển mã âm thanh và nội dung video
API Salad Transcription cho phép bạn Tạo các bản ghi chính xác, chú giải hoặc phụ đề. để nội dung âm thanh và hình ảnh sử dụng mô hình nhận dạng giọng nói như Whisper.
- Chuyển mã các tệp dài về nội dung của phim hoặc âm thanh
- Tính chính xác cao trong ngành công nghiệp cho những hiểu biết từ người yêu thích của bạn như GPT.
- Tìm kiếm hỗ trợ cho các định dạng tệp tin phổ biến , vì vậy bạn sẽ không cần phải chuyển đổi các tệp tin của mình.
Chuyển mã nội dung dài lên đến hai giờ thông qua API.
Chia sẻ nội dung của bạn trên toàn thế giới.
- Chuyển ngữ với độ chính xác cao bằng mô hình nhận dạng giọng nói (ASR) lớn nhất trong ngành Whisper Large V3.
- Tìm kiếm sự hỗ trợ cho 97 ngôn ngữ khác nhau. , bao gồm cả tiếng Anh, Tây Ban Nha, Nga, Ả Rập và nhiều ngôn ngữ khác.
Điều đó có nghĩa là bạn sẽ được phép Tạo nội dung toàn cầu với phụ đề và tựa đề để đảm bảo tuân thủ các yêu cầu về quyền lợi của người khuyết tật cho khán giả có khả năng nghe nhìn hạn chế.
Chuyển mã nội dung trong các ngôn ngữ lớn để kết nối với khán giả trên toàn thế giới.
Đoán chính xác người nói
Hơn nữa, Salad Transcription API cho phép bạn chênh lệch giữa người nói và hầu hết các phương ngữ để chuyển ngữ nội dung có nhiều người nói.
- Tạo mã thời gian câu và từ để có thời gian chính xác cho tiêu đề hoặc phụ đề
- Đánh giá điểm tin cậy để đo lường độ chính xác của mỗi từ.
- Tạo file SRT cho phụ đề hoặc chú thích để nhập khẩu vào các chương trình chỉnh sửa và chơi video
Tạo và chia sẻ những chú thích chính xác để ghi nhận nhiều người nói, ngôn ngữ khác nhau và các điệu vần khác nhau.
Các phiên âm của bạn, ngay tại ngón tay mình.
Khi bạn kết nối Salad Transcription API, bạn có thể Gửi các chỉ thị từ nền tảng của bạn qua JSON và nhận được các bản ghi. cũng theo cùng một định dạng như vậy.
- Xác định các tham số khác nhau như ngôn ngữ, thời gian của từ hoặc câu và nhiều hơn nữa.
- Thêm các kết quả xuất SRT vào trong phản hồi JSON của bạn. Để sử dụng cùng với nội dung của bạn.
Chỉ trong vài nhấp chuột, bạn sẽ nhận được một bản sao toàn bộ trong định dạng JSON và SRT .
Sử dụng mô hình chuyển đổi giọng nói thành văn bản, Salad Transcription API giúp dễ dàng ghi lại chính xác nội dung âm thanh và video của bạn cho bất kỳ trường hợp nào.
Chuyển mã nội dung mà không làm vỡ ngân sách.
Tải ngay ứng dụng dịch thuật Salad Transcription API và có quyền truy cập trọn đời vào các tính năng của nó hôm nay!
Các kế hoạch và tính năng
Điều khoản và điều kiện của thỏa thuận
- Truy cập suốt đời tới Salad Transcription API
- Tất cả các bản cập nhật kế hoạch kinh doanh nhỏ trong tương lai
- Nếu tên kế hoạch thay đổi, thỏa thuận sẽ được ánh xạ vào tên Kế hoạch mới với tất cả các cập nhật đi kèm.
- Bạn phải sử dụng mã của mình trong vòng 60 ngày kể từ khi mua hàng.
- Mã không giới hạn
- Mỗi mã bổ sung ngoài 10 sẽ tăng giờ biên dịch mỗi tháng thêm 200 giờ.
- Bán lại giờ phiên dịch là bị cấm.
Các tính năng được bao gồm trong tất cả các kế hoạch
- Được xây dựng với Whisper-Large-V3 là mô hình chính
- Chuyển mã âm thanh/video lên đến 2 giờ.
- Tất cả các ngôn ngữ hiện tại và tương lai (97 ngôn ngữ)
- Định danh giọng nói (tiếng Anh: Diarization, speaker recognition)
- Thời gian mã hóa câu/trả lời
- Loại bỏ ảo giác thông thường từ Whisper-Large-V3
- Ký tự, chú thích và phụ đề
- Hỗ trợ âm thanh (MP3, WAV, M4A,…)
- Hỗ trợ xem video (MP4, AVI, WMV, MKV, WEBM, v.v.)
- Nhận dạng giọng nói tự động
- Xuất JSON, SRT
Đánh giá
Chưa có đánh giá nào.