PHP 函数:检测字符串文本是否为有意义的文本 [重复]

可能重复:
有没有办法检测像 putjbtghguhjjjanika 这样的字符串?
php 检查字符串是否真实

我想要创建一个 PHP 函数来处理一个文本字符串,并将其传递给一个特殊的算法,以检测该文本是否有意义,并从 0 到 100% 给出文本的可读性评分。

例如:

“skjg askjf akdjf akdjf ” 大概是 30%。”Hello guys” 是 90%。”ahdkjshdkjshdkljshdlksjdh” 是 10% 或更少。

我希望这说得通。


回答:

这里有一些东西可以看看:https://github.com/DaveChild/Text-Statistics

这个项目将自己描述为:

PHP 文本统计类将帮助你识别网站内容的问题,特别是可读性方面的问题。 它允许你使用常见的评分系统来衡量文本的可读性,包括:

  • Flesch Kincaid 阅读简易度
  • Flesch Kincaid 年级水平
  • Gunning Fog 指数
  • Coleman Liau 指数
  • SMOG 指数
  • 自动可读性指数

生成统计信息的代码在一个简单的类结构中。 还有几个单元测试类来确保所做的更改不会破坏现有功能。 还有一个该工具的在线版本。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注