论文部分内容阅读
社交网络服务(SNS)通过互联网支持人们之间的沟通。然而,用户的SNS朋友可以透露关于用户的敏感信息。这使得用户与不同群组的朋友分享信息不安全。此外,披露用户信息的朋友难以识别。克服这个问题的一种方法是对通过泛化发布的文本中的敏感信息进行匿名化,但是为此方法提出的大多数方法都是用于数据库中的信息。另一种方法是通过使用各种同义词为某些敏感信息创建不同的指纹。然而,提出这样做的方法不会使信息匿名化。 因此,采用了一种基于算法的指纹ID识别,用于识别句子中的某些关键字。关键词使用泛化和同义词进行识别。为每个将收到发布文本的朋友创建一个不同的句子版本的关键字。指纹ID(关键字)不仅对用户的敏感信息进行匿名化,还可以用于识别已经公开了关于用户的敏感信息的人。使用修改的可辨别性度量来量化指纹ID,以确保每个组使用适当的隐私级别来接收所提出的文本。使用同义词可以确保在每个组中使用适当级别的隐私来接收发布的文本。此外,指纹ID不能被攻击者转换成导致算法错误地识别已经暴露敏感信息的人的指纹ID。该算法通过在用于控制Facebook上的信息披露的应用中被使用来证明。在本论文中,我探索了使用指纹关键词和操纵它们,以保护作者对社交媒体的敏感信息。句子中的名词被定义为每个帖子中改变的关键字,社交媒体上的用户朋友可以看到每个帖子的不同版本。使用替换名称的功能,在短语中选出名词(关键字),并将这样的社交媒体用户Y与朋友tID1进行更改,tID2将最终发送给两个朋友的同一个句子的不同版本。 在当今的社交媒体联盟世界中,更多的人比以往任何时候都可以轻易地达到数以千计的他们从未见过的人,并获得最多的私人信息和细节。总是有一个人,连接到SNS用户,的风险,他们不完全了解可能的后果,最终分享不是与不与作者特定信息相关的其他人共享的敏感信息。鉴于这些,我们提出了一种方式,一个作者(文本)可以至少跟踪一个用户谁损害了他在网络上看到的敏感信息。每个作者的观众都可以看到他最初发布的文字的不同版本,因此任何出版的版本都可以很容易地被追溯到非法分享它的人信息。