使用Python的PIP安装WordCloud Library

“词云”只不过是一种使用 Python 直观地显示文本数据集中单词出现频率的方法。 有一个名为 WorldCloud 的库,我们可以在 Python 中使用它来快速概述文本中最常见的单词,从而轻松识别关键主题和趋势。 在本教程中。 我们找到了使用 PIP(Python 包管理器)安装 WordCloud 库的命令,然后我们还演示了如何从文本数据生成词云。

您使用哪个操作系统并不重要 Windows, Linux,或MacOS; 要学习本教程,您的系统上必须已安装 Python 和 PIP。

不过,那些还没有的人可以看看我们的文章 – Python & 画中画 安装于 LinuxWindows

(选修的) 此外,如果您使用虚拟环境来隔离 Python 项目,这也是一个很好的方法。 您可以使用 virtualenv 或 venv 等工具创建虚拟环境,以在该环境中安装 WordCloud。

因此,想要设置虚拟环境的人可以按照以下步骤操作,否则请转到下一个步骤:

安装 Virtualenv 包:

sudo apt-get install python3-venv

使用给定的命令并创建一个新的 Python 虚拟环境:

python3 -m venv testenv

创建虚拟环境后,运行以下命令激活它:

source testenv/bin/activate

笔记: testenv 是我们的环境名称,如果您愿意,您可以提供其他名称:

步骤 2:使用 PIP 安装 WordCloud

在学习如何使用WordClouds之前,我们先来安装它。 安装包括 WordCloud 在内的 Python 库的最佳方法是 PIP。 因此,打开系统的命令终端或提示符并运行给定的命令。

pip install wordcloud --user

等待安装过程完成。 完成后,您就可以创建词云了。

第三步:生成Word示例 Cloud 在Python中

下面是一个简单的 Python 程序,演示了如何使用 WordCloud 库生成词云:

现在,创建一个文件来添加 Python 代码,我们在其中导入 Wordcloud 和创建词云所需的其他库。

nano word.py

在文件中添加以下给出的代码:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# Sample text data
text_data = "This is a sample text data for generating a word cloud. Word clouds are fun and informative visualizations."

# Create a WordCloud object
wordcloud = WordCloud(width=800, height=800, background_color="white", min_font_size=10).generate(text_data)

# Display the word cloud using matplotlib
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud)
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()

添加代码后,按保存文件 Ctrl+X, 类型 并点击 Enter 钥匙。

现在,运行使用给定命令创建的 Python 文件:

python word.py

笔记: 如果出现错误: raise ValueError(“Onlysupported for TrueType fonts”) ValueError: Onlysupported for TrueType fonts… 然后不要忘记升级您的 PIP 和 Pillow 版本。

pip install --upgrade pip
pip install --upgrade Pillow

这是您将在屏幕上看到的 WordCloud 输出。

解释:

在这个 example,我们首先导入了两个必要的Python库—— 词云Matplotlib。 之后,我们定义了要使用什么文本来创建词云。 接下来,在代码中,我们创建一个 WordCloud 对象,设置各种参数,例如宽度、高度、背景颜色和最小字体大小。

。产生() WordCloud 对象的方法用于根据提供的文本数据生成词云。 最后,我们使用 绘图库 将生成的词云显示为无轴图像。

请记住,我们只是给出了一个简单的 example。 WordCloud 不仅限于此。 您可以根据需要自定义词云的各个方面,例如颜色、字体和蒙版。 甚至,您还可以从文件或更复杂的数据集中读取文本数据,以创建信息更丰富的词云。

您可以探索以下一些自定义选项:

  • colormap:设置词云的颜色图。
  • font_path:指定自定义字体文件的路径。
  • mask:使用图像作为词云的形状蒙版。
  • stopwords:提供要从词云中排除的单词列表。

其他文章:

  • 使用 pip 安装 scikit-learn (sklearn)
  • 如何安装 Clang Ubuntu Linux
  • 如何安装 PIP Linux 没有 sudo?
  • 如何安装 AWS CLI Linux 使用Python的PIP