OpenAI 耳语 将把你的声音变成文字 Windows 11/10 设备。 由于该程序正在开发中 OpenAI,应该清楚人工智能是它能做什么的核心。 而如果 ChatGPT 有什么可以参考的,你可以相信 AI 为 Whisper 提供支持的技术是一流的。
此外,我们不得不说 Whisper 非常适合那些想要将语音转换为文本但资金不足的人。 那是因为 AI-powered 应用程序可免费下载和使用。
Whisper 有哪些缺点?
安装可能是大多数用户不喜欢的部分。 那是因为它并不直截了当。 它需要比正常情况更长的过程,这对于新手用户来说可能是个问题。
此外,不支持 AMD GPU。 那是因为这些 GPU 不支持 CUDA,CUDA 是 NVIDIA 创建的一种被视为并行计算平台和编程模型的工具。
因此,就目前而言,CUDA 仅支持 NVIDIA GPU,而从 AMD 的角度来看,最接近它的替代方案是 Radeon 计算平台和 OpenCL。 我们怀疑 OpenAI 将来会支持这样的平台,所以现在还得等等。
不过,我们必须指出,与其他软件相比,CUDA 更成熟,所以这可能是主要原因 OpenAI 决定暂时放弃 OpenCL 和 Radeon 计算平台。
如何下载和安装 OpenAIs Whisper Windows 11/10
在电脑上安装和使用Whisper需要使用PowerShell和安装Python等关键工具,涉及的步骤有:
- 下载并安装 Python
- 下载并安装 PIP
- 下载并安装 Chocolatey
- 下载并安装 FFMPEG
- 下载并安装耳语
- 使用 Whisper 将音频转换为文本
1]下载并安装 Python
如果您还没有这样做,请访问 Python官方网站,然后下载并安装该应用程序。
请记住,Python 没有用户界面,因此,一切都是通过命令行完成的。
2]下载并安装PIP
事情是这样的,如果你正在使用 蟒蛇 2.7.9 或更高版本,则默认安装 PIP。 这是因为 PIP 内置于 Python 安装程序中,因此我们建议下载最新版本,因为不会永远支持旧版本。
3]下载并安装Chocolatey
最后,您必须花时间将 Chocolatey 包下载到您的计算机上。
为此,打开 电源外壳 在你的电脑上作为 行政.
我们必须确保 获取执行策略 不受限制,因此运行以下命令并点击 Enter 钥匙。
Get-ExecutionPolicy
如果您看到 Restricted,请运行:
Set-ExecutionPolicy AllSigned
或者
Set-ExecutionPolicy Bypass -Scope Process
如果一切按计划进行,您将看到以下消息:
确保点击 Enter 粘贴后立即运行命令。 执行策略有助于保护您免受您不信任的脚本的侵害。 更改执行策略可能会使您面临关于执行策略帮助主题中描述的安全风险,网址为 https:/go.microsoft.com/fwlink/?LinkID=135170。
类型 是 选择是,然后单击 Enter 使更改正式生效的关键。
现在,您必须将以下命令粘贴到 PowerShell 中,然后像往常一样点击 Enter 钥匙:
Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))
耐心等待 Chocolatey 安装到您的计算机上。
4]下载并安装FFMPEG
然后,下一步是下载并安装 FFMPEG. 这只能在安装了 Chocolatey 的情况下完成。 此外,安装必须通过 PowerShell 工具完成。
将以下命令复制并粘贴到 PowerShell 中并选择 Enter:
choco install ffmpeg
您还必须通过以下命令安装 FFMPEG 的 Python 版本:
pip3 install python-ffmpeg
5]下载并安装耳语
最后使用如下命令获取 耳语 到您的计算机上:
pip3 install git+https://github.com/openai/whisper.git
现在一切都应该朝着正确的方向发展,所以祝贺你自己。
6]使用 Whisper 将音频转换为文本
一切都已安装并准备就绪,现在是转录的时候了。 由于没有 图形用户界面,命令提示符是您唯一的朋友。
现在,在我们开始之前,您必须录制一个音频文件,或者准备一个已经保存在您计算机上的文件。
所以让我们说,对于 example,我们有一个名为 TWCAudio.mp3,存储在名为 TWC事物.
这里要做的第一件事是使用以下命令更改目录:
cd C:TWCThings
使用以下命令在文件上运行 Whisper 工具:
whisper --model base --language gr --task translate TWCAudio.mp3
返回文件夹并查找文本文件。 在该文件中是文本形式的翻译音频。
读: 什么是 OpenAI 游乐场以及如何使用它?
你能在本地运行 Whisper 吗?
是的,可以在您的个人计算机上或从支持运行此开源语音识别应用程序的云平台上本地运行 Whisper。
会耳语 AI 离线使用?
耳语 AI 该工具支持离线使用,但在功能强大且运行速度快的计算机上效果最佳。 较弱的计算机将迫使用户等待很长时间才能转录文件,这完全取决于录音的长度。