Automatic Anonymous Fingerprinting of Text Posted on Social Networking Services

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:chris916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络服务(SNS)通过互联网支持人们之间的沟通。然而,用户的SNS朋友可以透露关于用户的敏感信息。这使得用户与不同群组的朋友分享信息不安全。此外,披露用户信息的朋友难以识别。克服这个问题的一种方法是对通过泛化发布的文本中的敏感信息进行匿名化,但是为此方法提出的大多数方法都是用于数据库中的信息。另一种方法是通过使用各种同义词为某些敏感信息创建不同的指纹。然而,提出这样做的方法不会使信息匿名化。  因此,采用了一种基于算法的指纹ID识别,用于识别句子中的某些关键字。关键词使用泛化和同义词进行识别。为每个将收到发布文本的朋友创建一个不同的句子版本的关键字。指纹ID(关键字)不仅对用户的敏感信息进行匿名化,还可以用于识别已经公开了关于用户的敏感信息的人。使用修改的可辨别性度量来量化指纹ID,以确保每个组使用适当的隐私级别来接收所提出的文本。使用同义词可以确保在每个组中使用适当级别的隐私来接收发布的文本。此外,指纹ID不能被攻击者转换成导致算法错误地识别已经暴露敏感信息的人的指纹ID。该算法通过在用于控制Facebook上的信息披露的应用中被使用来证明。在本论文中,我探索了使用指纹关键词和操纵它们,以保护作者对社交媒体的敏感信息。句子中的名词被定义为每个帖子中改变的关键字,社交媒体上的用户朋友可以看到每个帖子的不同版本。使用替换名称的功能,在短语中选出名词(关键字),并将这样的社交媒体用户Y与朋友tID1进行更改,tID2将最终发送给两个朋友的同一个句子的不同版本。  在当今的社交媒体联盟世界中,更多的人比以往任何时候都可以轻易地达到数以千计的他们从未见过的人,并获得最多的私人信息和细节。总是有一个人,连接到SNS用户,的风险,他们不完全了解可能的后果,最终分享不是与不与作者特定信息相关的其他人共享的敏感信息。鉴于这些,我们提出了一种方式,一个作者(文本)可以至少跟踪一个用户谁损害了他在网络上看到的敏感信息。每个作者的观众都可以看到他最初发布的文字的不同版本,因此任何出版的版本都可以很容易地被追溯到非法分享它的人信息。
其他文献
随着信息化的快速发展,人类的知识总量也在急剧增加,尤其是代表人类知识前沿的科技文献正在以每年6%-8%的速率增长。这就使得论文检索难度大大增加。科研人员为了找到自己需
随着多媒体通信时代的到来,网络多媒体、无线多媒体业务逐渐受到越来越多用户的青睐。靠现存的视频压缩标准已经不能满足应用需求。因此,ITU的视频编码专家组与ISO的运动图像编
本研究从搜索和分析农作物信息、环境地理信息和管理信息及三者之间的关系入手,利用GIS和ES集成技术,综合现有的技术成果和专家经验,建立了以农作物管理为主体的电子农务平台,以
经典智能规划多是在强约束假设条件的基础上建模的,例如要求规划agent对于动作的结果的知识完全,且规划agent执行动作的结果是确定的,从而不能运用于大多数实际系统和实际领域中
在分布式环境尤其是包含异构系统的分布式环境中,系统管理比集中式系统要困难得多.理想的是提供一个单点控制,所有系统都可在此管理.高度集中的管理由于其复杂性和权力分配问
当今围绕着JVM的研究和开发日益增多.在各种JVM发展的同时,也带来另一种需求——如何提供运行在JVM上的各种软件,如何将现有系统移植到JVM上运行?单纯地利用Java编程,一方面
随着计算机网络技术的飞速发展,网络安全问题日益受到人们的重视,相关的网络安全技术的研究也越趋深入.传统的网络安全产品已不能满足现代P2DR动态系统安全模型的要求.人们迫
本课题来源于深圳市民中心屋顶网架结构健康智能监测系统项目。本文的主要内容是研究如何创建多媒体视景环境、大型屋架结构受力分析的有限元结果数据可视化的相关算法以及可
有线电视网络是信息化进程中一个重要的基础网络,HFC有线电视网有着极好的数据传输环境,具有高带宽、大容量和很高的用户拥有率,而被国际上公认为是通向广大用户多种信息业务的
随着计算机网络的广泛普及和人们对多媒体信息的需求不断提高,低码率图像压缩编码技术成为活跃的研究领域.MPEG-4作为新一代多媒体压缩标准,将众多多媒体应用集中于一个完整