使用BiLSTM CRF分词模型,在SIGHAN MicrosoftResearch数据集上进行中文分词的训练和测试。
运行方法可在readme看到,同时有详细报告描述【源码目录】中山大学_中文分词├── readme.md
├── 代码
│ ├── cws.py
│ ├── msr_test.utf8
│ ├── msr_test_gold.utf8
│ ├── msr_training.utf8
│ ├── result.txt
│ ├── test_score.py
│ ├── train.py
│ └── train_result.pkl
├── 中文报告.docx
└── 英文报告.docx
1 directory, 11 files
评论