PHP 函数:检测字符串文本是否为有意义的文本 [重复]

可能重复:
有没有办法检测像 putjbtghguhjjjanika 这样的字符串?
php 检查字符串是否真实

我想要创建一个 PHP 函数来处理一个文本字符串,并将其传递给一个特殊的算法,以检测该文本是否有意义,并从 0 到 100% 给出文本的可读性评分。

例如:

“skjg askjf akdjf akdjf ” 大概是 30%。”Hello guys” 是 90%。”ahdkjshdkjshdkljshdlksjdh” 是 10% 或更少。

我希望这说得通。


回答:

这里有一些东西可以看看:https://github.com/DaveChild/Text-Statistics

这个项目将自己描述为:

PHP 文本统计类将帮助你识别网站内容的问题,特别是可读性方面的问题。 它允许你使用常见的评分系统来衡量文本的可读性,包括:

  • Flesch Kincaid 阅读简易度
  • Flesch Kincaid 年级水平
  • Gunning Fog 指数
  • Coleman Liau 指数
  • SMOG 指数
  • 自动可读性指数

生成统计信息的代码在一个简单的类结构中。 还有几个单元测试类来确保所做的更改不会破坏现有功能。 还有一个该工具的在线版本。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注