【摘 要】
:
星际文件系统(interplanetary file system,IPFS)实现了去中心化存储,可以满足日益增长的数据存储需求,然而IPFS仅提供一种精确的数据获取方式,在缺乏数据唯一标识时无法查找数据.现有的IPFS数据获取方法削弱了IPFS的去中心化,仅实现了关键字搜索,对长查询语句进行关键词搜索加重了网络负担.为此,提出了一种去中心化混合索引的IPFS数据获取方法——IPFS-DDAM.提取数据的关键词及中心语句以建立关键词索引及句子索引;使用分布式哈希表(distributed Hash tab
【机 构】
:
中国科学院 新疆理化技术研究所,乌鲁木齐 830011;中国科学院大学,北京 100049;中国科学院 新疆理化技术研究所 新疆民族语音语言信息处理实验室,乌鲁木齐 830011
论文部分内容阅读
星际文件系统(interplanetary file system,IPFS)实现了去中心化存储,可以满足日益增长的数据存储需求,然而IPFS仅提供一种精确的数据获取方式,在缺乏数据唯一标识时无法查找数据.现有的IPFS数据获取方法削弱了IPFS的去中心化,仅实现了关键字搜索,对长查询语句进行关键词搜索加重了网络负担.为此,提出了一种去中心化混合索引的IPFS数据获取方法——IPFS-DDAM.提取数据的关键词及中心语句以建立关键词索引及句子索引;使用分布式哈希表(distributed Hash table,DHT)存储索引,数据内容相似的句子索引存储相邻,实现了句子索引的邻近范围搜索及关键词索引的精确搜索;改进缓存存储机制,减少冗余存储;通过在公开数据集上的仿真实验证明了该方法的有效性,并且减少了网络负担.
其他文献
查询是数据库系统的主要负载,为查询选择合适的执行计划是提高数据库系统性能、最终提升应用系统性能的关键.针对当前查询优化器为并发查询选择的执行计划准确率较低、动态性不足的问题,利用长短期记忆(long short-term memory,LSTM)网络的时域特性和全连接层网络(full connected networks,FCN)对特征的融合及分类优势,提出基于LSTM-FCN的并发查询执行计划选择方法.设计并编码查询组合的执行计划特征和交互特征,将其作为网络的输入,为查询动态选择适合实际运行场景的执行计
通过对码垛机器人相关文献进行归纳整理,从结构优化、末端执行机构、运动规划、运动控制、机器人编程、国内应用等六个方面对码垛机器人进行了概述,分别阐述了机器人本体结构优化、运动规划的常见方法、机器人编程的常用手段、机器人控制的常用方法、避障规划的难点、多机器人协同的特殊性、各类型末端执行机构的优缺点,随后针对我国的码垛机器人应用现状,提出了对应的解决措施,针对码垛机器人关键技术的研究,指出了未来的发展方向和研究重点,可为相关研究人员提供参考.
知识图谱主要用于从复杂数据中抽取出关键信息以生成关系网络,其对于复杂关系出色的识别能力以及对于数据较强的描述能力使得知识图谱技术具有很高的应用价值.为给知识图谱在海洋领域的应用提供理论支撑,对知识图谱相关技术进行了总体概述.阐述Citespace文献分析工具的出色应用,针对海洋领域半结构化和非结构化数据抽取技术进行了系统整理,并分析了诸如命名实体识别、关系抽取、事件抽取、知识融合以及知识推理等关键性技术的原理及后续改进,对海洋领域应用知识图谱技术的落地场景及未来前景进行总结与展望.
征信数据涉及个人的高度隐私,在收集和查询的过程中极易泄露或者收集到不真实的数据,征信数据的泄露会给被泄露人带来名誉损害和财产威胁等严重影响,为减少征信数据采集时用户隐私泄露、信息不对称、易篡改、易伪造和过中心化等问题,提出了一种融合双区块链的征信数据存储和查询方案,该方案由两条链组成,一条链用于存储多人的实时征信数据收集,另一条链用于存储个人的征信报告,融合双区块链的方案不仅能保证征信机构实时征信数据的收集记录,而且能够快速自动生成个人的征信报告,避免了个人征信数据在征信查询过程中的隐私泄露、篡改和伪造风
国家商用密码算法SM2是基于椭圆曲线密码学(ECC)而制定的公钥密码协议,已被国际标准化组织(ISO)确立为国际标准.在实际应用中,SM2算法计算过程的复杂性使其面临实现效率低的问题,并且在实现过程中还会出现与密钥相关的侧信道信息泄露.为了解决上述问题,设计了一种适用于SM2的专用指令硬件协处理器.协处理器包含接口逻辑、取指单元、译码单元、执行单元、程序存储单元和数据存储单元,借鉴通用CPU的流水线技术,将指令的实现过程分为取指、译码、执行、写回四级流水,以提高计算效率.经过在Xilinx ZYNQ-7
针对AES算法Cache计时模板攻击时会触发大量的Cache失效,容易被硬件计数器检测出来的问题,基于Flush+Flush攻击模型,提出一种基于欧氏距离的AES算法模板攻击方法,以减少触发Cache失效的次数,使攻击更加隐蔽.使用Flush+Flush攻击模型获取AES算法在内存中映射的位置;利用已知明文攻击不断地触发密码进程,通过该模型建立每一个密钥的模板;利用Flush+Flush攻击模型获取真实情况下的Cache计时信息,通过计算计时信息与每一个密钥模板之间的欧式距离推算密钥.通过实验验证,以Op
短文本相比于长文本词汇的数量更少,提取其中的语义特征信息更加困难,利用传统的向量空间模型VSM(vector space model)向量化表示,容易得到高维稀疏的向量.词的稀疏表示缺少语义相关性,造成语义鸿沟,从而导致下游聚类任务中,准确率低下,容易受噪声干扰等问题.提出一种新的聚类模型BERT_AE_K-Means,利用预训练模型BERT(bidirectional encoder representations from transformers)作为文本表示的初始化方法,利用自动编码器AutoEn
区块链分片方案中的跨分片交易由多个分片协调处理.在采用实用拜占庭容错(practical Byzantine fault tolerance,PBFT)类共识算法的分片方案中,存在因分片后拜占庭节点在单个分片聚集,导致分片失效无法验证交易的问题.因此,为保证分片间数据的一致性,需要对部分处理的跨分片交易进行回滚操作,这影响了系统的总体性能.针对以上问题,提出了一种多轮共识的验证方案,可以在降低回滚概率的基础上,支持更大分片规模,提升系统的每秒交易数(transaction per second,TPS).
区块链在商业交易领域的快速发展及应用,尤其是交易合同的签署对公平的需求,导致传统的单向信任模式的区块链需要更换为双向信任模式.基于已有的多种公平合同签署协议(fair contract signing protocol,FCSP),提出一种面向Fabric区块链的快速公平合同签署协议(TFCSP),与已有FCSP的分步多次区块上传或者简单智能合约的实现不同,TFCSP通过修改Fabric的gossip进程,由交易发起方对交易签名、接收方对块信息验证并签名再进行上传,这种多次异步签名一次上传及二次验证合约内
为了解决机器学习在样本量较少的情况下所面临的巨大挑战,研究人员提出了小样本学习的概念.在现有的小样本学习研究工作中,嵌入学习方法取得了不错的效果,引发了大量关注.根据训练特征嵌入函数时结合任务特征信息的方式,将嵌入学习方法划分为单一嵌入模型和混合嵌入模型两大类.依据划分的类别,对现有的嵌入学习方法的研究工作展开进行研究.汇总了现有的小样本标准数据集,阐述了每一类嵌入学习方法的表现,分析了影响小样本学习性能的因素.讨论嵌入学习方法目前面临的挑战,并展望未来的研究方向.