基于深度学习的钓鱼网站检测框架

网络钓鱼
图片来源:Pixabay/CC0 公共领域

我们中的大多数人都会收到一封诈骗电子邮件,看起来像是来自我们的银行、在线商店或其他公司或组织。它们看起来是真实的,但通常隐藏在其中的恶意链接,一旦点击这些链接就会将您带到第三方服务器,该服务器要么窃取您输入的登录详细信息,要么在您的设备上投放恶意软件。这些是网络钓鱼电子邮件。故意将“fish”与“ph”拼错在词源上与术语“phreak”有关,它是 1960 年代的缩写词,意思是“电话怪胎”,暗指为了娱乐或个人利益而侵入电话系统的人。

一些网络钓鱼电子邮件的语法可能很差,拼写很少是完美的,或者布局可能会歪斜,不完全符合人们对合法组织的期望。这种网络钓鱼攻击相对容易被发现,但接近完美的攻击很可能不是这样,因此需要在设备上安装保护系统,以避免用户被欺骗点击恶意链接。

国际信息隐私、安全和完整性杂志上,一个来自中国的团队开发了一个基于深度学习的框架,可用于检测网络钓鱼网站。位于中国广州的工业和信息化部第五电子研究所的王焕焕、Debin Cheng 和 Hui Peng 解释了他们的框架如何从网站中提取描述性和统计特征,然后确定这些特征是否表明钓鱼网站。此类站点的检测随后可用于在线安全研究,甚至可能被纳入浏览器以保护粗心的用户免遭网络钓鱼。

该团队已经测试他们的系统对两个数据库,一个包含该网站10000个合法,否则良性网站1.3万页的URL地址(统一资源定位符,网址),网站PhishTank公共数据集发现,以前一直自己上钩,并确定为非法. 该团队已经证明了近 99% 的检测准确率,他们说这是对早期网络钓鱼检测方法的重大改进。他们所采取的方法也可能指向该领域的新研究领域,以及可并入移动和桌面设备安全系统的检测系统的开发和优化。

本文为作者 三石 独立观点,并不代表 我是CIO 立场。

发表评论

登录后才能评论