我在研究分类算法,并且获得了一些具有某种模式的不同字符串代码。
|:-----------|------------:|:------------:|| Column 1 | Column 2 | Column 3 ||:-----------|------------:|:------------:|| MN009 | JIK9PO | LEFTu || MN010 | JIK9POS | LEFTu || MN011 | JIK9POKI | LEFTu || MN012 | KIJU | LEFTu || MN013 | RANDOM | LEFTu || MN014 | FT | LEFTu ||:-----------|------------:|:------------:|
对于第1列和第3列,特征集可以是长度为5的向量。
但我不知道如何创建一个特征集来同时容纳第2列的数据。
考虑因素:
- 创建一个与最长字符串长度相同的特征向量,对于较短的字符串添加一些填充物。
- 将字符串截断到固定长度,例如这里的5,并忽略多余的字符。
希望我的问题已经表达清楚。谢谢 🙂
回答:
有两种解决方案: