查询到最新的3条

文老师,教师节快乐

有这样一个现象:现在,尤其是在网络上,越来越多的人不爱用标点符号了,难道是他们已经淡忘了一些标点符号的正确用法,甚至已经不认识一些标点符号了吗?不仅标点符号如此,一些字词有时候也会被不正确地使用,比如“的”“地”“得”三个字就经常被“张冠李戴”。 有人认为上述现象体现了网民们语文基础知识的欠缺,需要加强学习规范使用标点符号和字词的相关基础知识,并认为用错字或标点的行为是非常令人反感的;也有人认为文字作为一种工具,只要能达到传递信息的目的就可以了,用错几个字词标点并不会影响其 继续阅读

Python isprintable()

python 中的isprintable()函数有助于检查字符串中的所有字符是可打印字符还是空字符串。如果所有字符都是可打印的或为空字符串,则函数返回真,否则返回假。 **string.isprintable()** isprintable()参数: isprintable()方法不接受任何参数。字符串中可打印的字符包括字母和符号、数字、标点符号和空白。不可打印字符是指那些在打印时不可见且不占用空间的字符(转义字符,如' \n ',' \t ' 继续阅读

Python文本聚类分析

本文将会从数据预处理、特征提取、聚类算法选择等多个方面详细介绍Python文本聚类分析的步骤和方法。 一、数据预处理 数据预处理是文本聚类分析的第一步,其目的是对原始文本数据进行去噪、规范化、标准化等处理,以便后续的特征提取和聚类。 常见的文本预处理方法有: 1、去除停用词和标点符号,如“的”、“了”等,可以减小文本的维度,加快计算速度; import jieba import re #去除停用词和标点符号 def clean_text(text): 继续阅读