题目内容
(请给出正确答案)
[单选]
将两篇文本通过词袋模型变为向量模型,通过计算向量的()来计算两个文本间的相似度。
A、正弦距离
B、余弦距离
C、长度
D、方向
查看答案
A、正弦距离
B、余弦距离
C、长度
D、方向
A、文本分类是指按照预先定义的主题类别,由计算机自动地为文档集合中的每个文档确定一个类别
B、文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统
C、文本的向量形式一般基于词袋模型构建,该模型考虑了文本词语的行文顺序
D、构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤
A、词袋模型可以忽略每个词出现的顺序
B、词袋模型不可以忽略每个词出现的顺序
C、TensorFlow支持词袋模型
D、词袋模型可以表出单词之间的前后关系
A、关键词提取是指用人工方法提取文章关键词的方法
B、TF-IDF模型是关键词提取的经典方法
C、文本中出现次数最多的词最能代表文本的主题
D、这个问题设计数据挖掘,文本处理,信息检索等领域