训练SyntaxNet需要多少数据?

我知道数据越多越好,但训练SyntaxNet需要多少数据才算合理呢?


回答:

通过一些试验和错误,我得出了以下最低要求:

  • 训练语料 – 18,000个词元(少于这个数量,步骤2 – 使用标注器进行预处理 – 会失败)
  • 测试语料 – 2,000个词元(少于这个数量,步骤2 – 使用标注器进行预处理 – 会失败)
  • 开发语料 – 2,000个词元

    但请注意,使用这些数据,我只成功运行了NLP流程中的各个步骤,实际上并没有得到任何可用的结果。

  • Related Posts

    使用LSTM在Python中预测未来值

    这段代码可以预测指定股票的当前日期之前的值,但不能预测…

    如何在gensim的word2vec模型中查找双词组的相似性

    我有一个word2vec模型,假设我使用的是googl…

    dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

    我试图使用 XGBoost 创建模型。 看起来我成功地…

    ML Tuning – Cross Validation in Spark

    我在https://spark.apache.org/…

    如何在React JS中使用fetch从REST API获取预测

    我正在开发一个应用程序,其中Flask REST AP…

    如何分析ML.NET中多类分类预测得分数组?

    我在ML.NET中创建了一个多类分类项目。该项目可以对…

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注