网站首页 > 技术文章 正文
1.参数建模
样本数据可以根据自己的Nginx系统日志来,也可以在网上搜集,为了降低入门难度,我对数据采取最简单的建模,135507个XSS白样本作为训练,16151个XSS黑样本作为验证。
泛化规则如下:
- 英文字母全用4表示
- 数字全用3表示
- 特殊字符用2表示
- 其他用1表示
2.数据处理与特征提取
由于采集的数据全部都是GET请求,为了简化,仅仅对数据进行URL解码,之后进行泛化。
3.模型训练
remodel = hmm.GaussianHMM(n_components=N, covariance_type="full", n_iter=100)
remodel.fit(X,X_lens)
4.模型验证
等啊等........
出来的结果也有很多特殊字符,直接过滤掉,
15926 # 得分大于200的数量
16152 # 过滤特殊字符后剩余总量
0.986007924715 #超过98%的准确率
5.完整代码
import sys
import urllib
import urlparse
import re
from hmmlearn import hmm
import numpy as np
from sklearn.externals import joblib
import HTMLParser
import nltk
#状态个数
N=10
#最大似然概率阈值
T=-200
SEN=['<','>',',',':','\'','/',';','"','{','}','(',')']
def etl(str):
vers=[]
for i, c in enumerate(str):
c=c.lower()
if ord(c) >= ord('a') and ord(c) <= ord('z'):
vers.append([4])
elif ord(c) >= ord('0') and ord(c) <= ord('9'):
vers.append([3])
elif c in SEN:
vers.append([2])
else:
vers.append([1])
return np.array(vers)
def main(filename):
X = [[0]]
X_lens = [1]
with open(filename) as f:
for line in f:
line=line.strip('\n')
line=urllib.unquote(line)
vers = etl(line)
X=np.concatenate( [X,vers])
X_lens.append(len(vers))
remodel = hmm.GaussianHMM(n_components=N, covariance_type="full", n_iter=100)
remodel.fit(X,X_lens)
return remodel
def test(remodel,filename,fp):
with open(filename) as f:
for line in f:
line=line.strip('\n')
line=urllib.unquote(line)
vers = etl(line)
pro = remodel.score(vers)
fp.write("SCORE:(%d) XSS_URL:(%s)\n " % (pro, line))
if __name__ == '__main__':
fp=open("hmm.txt",'r+')
remodel=main(sys.argv[1])
test(remodel,sys.argv[2],fp)
fp.close()
猜你喜欢
- 2024-10-24 破解神经网络、攻击GPU,AI黑客教程来了,已登GitHub热榜
- 2024-10-24 win10子系统:python开发环境准备(kenlm和nltk的使用教程)
你 发表评论:
欢迎- 最近发表
-
- 吴谨言专访大反转!痛批耍大牌后竟翻红,六公主七连发力显真诚
- 港股2月28日物业股涨幅榜:CHINAOVSPPT涨1.72%位居首位
- 港股2月28日物业股午盘:CHINAOVSPPT涨1.72%位居首位
- 港股3月2日物业股涨幅榜:CHINAOVSPPT涨1.03%位居首位
- 港股3月2日物业股午盘:CHINAOVSPPT涨1.03%
- 天赋与心痛的背后:邓鸣贺成长悲剧引发的深刻反思
- 冯小刚女儿徐朵追星范丞丞 同框合照曝光惹人羡,回应网友尽显亲民
- “资本大佬”王冉:51岁娶小17岁童瑶,并承诺余生为娇妻保驾护航
- 港股3月2日物业股午盘:CHINAOVSPPT涨1.03%位居首位
- 「IT之家开箱」vivo S15 图赏:双镜云窗,盛夏风光
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)