【摘 要】
:
为解决TF-IDF模型表达情感信息不足的问题,提出一种情感Senti模型,通过该模型提取文本中的情感信息,包括句子中积极/消极的情感词、否定词、转折词以及程度副词,考虑标点符号
【机 构】
:
上海理工大学管理学院,金陵科技学院软件工程学院
【基金项目】
:
国家社会科学基金“基于大数据关联分析的中国雾霾污染问题统计研究”(15BTJ017),上海高校智库内涵建设计划(战略研究)项目“基于云电子商务的上海市数字资源共享战略研究”,安徽大学计算智能与信号处理教育部重点实验室开放课题“大数据挖掘服务平台的数据管理与算法管理理论研究”
论文部分内容阅读
为解决TF-IDF模型表达情感信息不足的问题,提出一种情感Senti模型,通过该模型提取文本中的情感信息,包括句子中积极/消极的情感词、否定词、转折词以及程度副词,考虑标点符号在句子中起到的情感作用,利用情感词典和语义规则提取情感信息,生成相应的情感矩阵。在此基础上,与TF-IDF模型进行拼接,形成混合向量模型。实验结果表明,与只运用TF-IDF模型相比,混合向量模型精确度更高,具有较好的分类效果。
其他文献
在肺癌早期筛查过程中,人工诊断胸部CT扫描图像费时费力,而深度学习网络缺乏足够的医学数据进行训练。为此,提出一种渐进式微调(PFT)策略,将其应用于深度迁移学习网络以辅助诊断肺结节良恶性。利用神经网络在粗粒度的自然图像大数据集中学习特征知识,经重构网络分类层将所学到的特征信息迁移至肺结节的细粒度小数据集。采用PFT策略从全连接分类层开始,逐层释放、微调训练卷积层直至所有网络层,并通过定量分析各层微
在地市级媒体平台化建设中,互联网逻辑也浸润到传播全环节,“平台型媒体”初具规模,但同时也存在一些乱象和不足,必须引起业界重视。本文针对地市级媒体平台化建设现状及问题
<正>推进金融法治建设,是金融业自身发展的需要,更是落实以法治国方略的基本要求。当前我国正处于全面建成小康社会的决定性阶段,经济发展进入新常态,改革发展稳定任务之重前
复合材料细观损伤研究方法可以在细观的尺度上对复合材料的力学性能和损伤失效进行研究。通过细观尺度上的胞元建立损伤萌生与演化模型,根据细观损伤演化模型确定细观损伤变量
随着财政部印发的《行政事业单位内部控制规范(试行)》自2014年1月1日正式实施,各中小学根据规范陆续建立了内部控制制度。本文基于对我区47所中小学内部控制制度建设情况的