什么是N-grams?
我想为句子 – “狗吠不咬” 找出 n=4(四元组)、n=5(五元组)、n=6(六元组)、n=7(七元组)的N-grams
我知道-
一元组(n=1):狗,吠,不,咬
二元组(n=2):狗吠,吠不,不咬
三元组(n=3):狗吠不,吠不咬
对于给定的句子,我们能找到多少个N-grams?
回答:
对于至少有’N’个单词的句子,可以存在N-grams。因此,在你的例子中,“狗吠不咬”有6个单词,所以你最多可以构建6-grams(1,2,3,4,5,6 – Grams),而不能超过这个数量。因此,结果将是
-
4-grams:狗吠不咬,吠不咬,
-
5-grams:狗吠不咬,吠不咬,
-
6-grams:狗吠不咬