机器学习和web安全交叉的一些脑洞

机器学习和web安全交叉的一些脑洞

这些脑洞来自于这次“安全数据与机器学习“小密圈/知识星球的一个答题赠书活动 t.xiaomiquan.com/2JmEQZ 大家开展脑洞,想一想web安全方向里有哪些具体的方向可能可以用机器智能的办法解决,以下是精选回答。这些回答可能催生大公司内革命性的新项目或新的数据模型推动的安全创业公司因此诞生,想一想都很激动啊。感谢这次赠书的本圈优秀圈友也是《Web安全之机器学习入门》的作者兜哥。

神棍甲
威胁情报里的舆情分析入库及其扩展,机器才能对大量公开数据/自家私有数据/大量网站进行处理,全面的人物画像才能更好更快的抓到黑产团队人员网中的疏漏点

比特密
电商网站里可以对用户的访问轨迹,进行聚类。这样可以根据行为轨迹是否符合大多数行为,来判定该用户是不是恶意用户。

Rozero
1,大家都在做WEB攻击日志分析,常用的方法网上也有很多。我比较感兴趣的是机器学习对于攻击成功去验证的话有没有什么新思路。
2,网站注册过程中、如何能够从数据中分析出垃圾注册用户。机器学习如何能更好发现垃圾注册及马甲账号。
3,机器学习如何去学习用户访问行为轨迹,目前这块听了很多方法,有没有更好一些的。

早上起来做运动
1.基于大数据绘制用户ip画像,基于用户的访问轨迹/行为来判断是否是恶意用户
2.利用机器学习分析业务逻辑接口。发现基于业务的安全漏洞越权/负值购买/短信邮件轰炸,刷充值等
3.在站点攻击流量的判断上,使用正负样本训练动态制定规则,实时进行攻击管控及应急处理
4.系统日志分析,流量回放判断用户可疑操作行为及危害绘制用户画像并自动测试输出分析
5.威胁样本处理,根据恶意行为分析如僵尸变种,进行流量跟踪范围危害
6.威胁情报,判断情报是具有一定危害性的安全漏洞还是功能漏洞并能判断大致影响范围及基本修复措施。

Dark Matter
目前大部分的机器学习在安全领域的应用都是去改进或者优化原有的某种安全产品。能不能引入深度强化学习,去控制各种现有的安全产品,自主决策,不引入安全专家的情况下就自动化地解决大部分安全问题?初始化一个agent,从日志,扫描器等感知当前系统状态,然后通过控制安全产品执行action,使系统达到最安全的状态以获取最大回报?

不倒大蛋壳儿
类threatcrowd系统,关系图中数据量过大之后,需要导入一些预训练好的攻击模型来减少干扰,辅助分析人员追踪。从时间、地域、行业、手段、组织等纬度点亮攻击脉络,区分多次攻击行为。一千个点的关系图和一个点的关系图在我看来是一样的。

题图来自于Free photo Cat Animal Kitten Domestic Cat Pet Cat Baby Cute - Max Pixel 遵循非商业使用原则。


大家好,这是“安全数据与机器学习”专栏的第九篇文章。这个专栏配合我们的小密圈/知识星球群组“安全数据与机器学习”和我们的blog专栏 Kakapo - 一个机器学习社区 ,给各位安全届的朋友提高锻炼数据建模和机器学习的知识。我们会不定期寻找一些优秀的文章,在这里写上摘要和导读,引导大家前去深入学习。如果想参与“安全数据与机器学习”的讨论,请下载“知识星球”app并搜索“安全数据与机器学习“或者点击 t.xiaomiquan.com/IIqZV7 接受邀请。

编辑于 2017-12-13

文章被以下专栏收录