Whisper：把视频和语音文件转换成文字

openai开源免费部署自己的语音识别系统

返回上一页

描述

Whisper项目允许用户轻松将语音和视频文件转换为文本，支持多种语言识别，无需高性能GPU即可在家用电脑上运行。通过简单的步骤，用户可以搭建自己的语音识别服务，为视频制作字幕、整理访谈记录等多种应用场景提供强大支持。

介绍

最近，OpenAI 把自己的语音识别项目 Whisper 开源了，声称能把视频和语音文件转换成文字。听说效果能和科大讯飞那些收费产品一较高下，而且最妙的是，这玩意儿不需要 GPU，家用电脑就能跑！

我是个折腾爱好者，尤其对这种开源项目兴趣满满。官方文档固然详细，但我这次打算走个捷径，找到了一个基于 Whisper 的 web 服务项目，直接用 Docker 部署，听起来是不是很酷？

home_open_whisper_1

下载 Docker 镜像

在 Docker 里搜索 openai-whisper-asr-webservice，拉下第一个镜像。

home_open_whisper_2

启动服务

    
    docker run -d -p 9000:9000 -e ASR_MODEL=base onerahmet/openai-whisper-asr-webservice:latest

运行完毕后，打开浏览器访问 http://localhost:9000/，初次访问会下载模型，稍等片刻后，就能看到部署成功的页面，简单至极！

home_open_whisper_3

开始使用

提供了两个 HTTP 接口：语音识别和语言检测。语音识别接口，上传文件后转换成文字；语言检测接口，则是识别上传文件的语言类型。

home_open_whisper_4

音/视频转文字

试了下英文音频，上传后点击执行，一会儿工夫就看到了转换结果。

home_open_whisper_5

语言检测

还能检测视频或音频文件里的语言类型，这对于多语言文件也是非常友好的。

home_open_whisper_6

OpenAI的Whisper项目通过其开源和容易部署的特性，为广大用户和开发者提供了一个强大的语音识别工具。它不仅能够处理复杂的语音识别任务，还降低了技术门槛，使得更多的人能够利用这一技术。通过Docker容器化技术，Whisper的部署和使用变得前所未有的简单，进一步推动了人工智能技术的普及和应用。

类别

松鼠盒子AI是什么？

松鼠盒子AI是专业靠谱的AI人工智能工具评测推荐网站。已收录了国内外上千款AI工具、GPTs应用，涉及AI副业、AI编程、AI写作、AI问答、AI绘画、AI自媒体、AI开源项目等领域，可以通过类别和功能来搜索和过滤这些工具；同时也整理了ChatGPT、Stable Diffusion、Midjourney、Prompt Engineering、Sora等AI工具使用教程。

免责声明

本站内容整理自网络，所提供内容仅供学习使用，请勿做非法用途，不得以任何方式利用本网站提供内容直接或间接从事违反中国法律法规，以及社会公德的行为。若本站内容涉嫌侵犯他人知识产权或其他合法权益的内容，请及时联系立即删除；本站尊重并保护所有用户的个人隐私权。

RPA

八爪鱼RPA

支持一键抓取公众号/小红书/抖音/淘宝数据

流程自动化

付费

AI爆文训练营

图文变现友好赛道，低门槛、高上限，教你从0到1做个赚钱的公众号!

躺着赚钱

￥149/年

何老师陪你做副业

这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔，只分享有价值的副业项目。

AI赚钱案例

限免

DeepSeek进阶教程

带你全面掌握DeepSeek应用技巧。提升工作、学习效率

100万人学过

付费

网盘拉新实战教程

每周花费一小时，手把手教你赚网盘平台佣金

500人学过

限时优惠

AiPPT

结合最新AI技术，为用户提供一键生成高质量PPT的解决方案。

一键生成 PPT

免费

豆包MarsCode

一款免费的AI编程助手，全新支持DeepSeek R1/V3、豆包大模型1.5自由切换，免部署、更准确、更强大！

AI编程助手

免费

Monica AI

Monica AI满血复活DeepSeek【免费】，提升您的聊天、搜索、写作和编程体验。

一站式 AI 助手

云服务

腾讯云

综合性的云计算服务平台，现已接入DeepSeek，提供多样化的云解决方案

高效可靠

云服务

阿里云

全球领先的云计算与数据服务平台，提供云服务器、存储、数据库、安全等多种服务

多样化

DeepSeek企业微信码

免费领取DeepSeek资料