图2是后端融合方法的流程图。图3是中间融合方法的流程图。图4是前端融合模型的架构图。图5是前端融合模型的准确率变化曲线图。图6是前端融合模型的对数损失变化曲线图。图7是前端融合模型的检测混淆矩阵示意图。图8是规范化前端融合模型的检测混淆矩阵示意图。图9是前端融合模型的roc曲线图。图10是后端融合模型的架构图。图11是后端融合模型的准确率变化曲线图。图12是后端融合模型的对数损失变化曲线图。图13是后端融合模型的检测混淆矩阵示意图。图14是规范化后端融合模型的检测混淆矩阵示意图。图15是后端融合模型的roc曲线图。图16是中间融合模型的架构图。图17是中间融合模型的准确率变化曲线图。图18是中间融合模型的对数损失变化曲线图。图19是中间融合模型的检测混淆矩阵示意图。图20是规范化中间融合模型的检测混淆矩阵示意图。图21是中间融合模型的roc曲线图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例**是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。负载测试证实系统最大承载量较宣传数据低18%。北京软件检测报告定制
综合上面的分析可以看出,恶意软件的格式信息和良性软件是有很多差异性的,以可执行文件的格式信息作为特征,是识别已知和未知恶意软件的可行方法。对每个样本进行格式结构解析,提取**每个样本实施例件的格式结构信息,可执行文件的格式规范都由操作系统厂商给出,按照操作系统厂商给出的格式规范提取即可。pe文件的格式结构有许多属性,但大多数属性无法区分恶意软件和良性软件,经过深入分析pe文件的格式结构属性,提取了可能区分恶意软件和良性软件的136个格式结构属性,如表2所示。表2可能区分恶意软件和良性软件的pe格式结构属性特征描述数量(个)引用dll的总数1引用api的总数1导出表中符号的总数1重定位节的项目总数,连续的几个字节可能是完成特定功能的一段代码,或者是可执行文件的结构信息,也可能是某个恶意软件中特有的字节码序列。pe文件可表示为字节码序列,恶意软件可能存在一些共有的字节码子序列模式,研究人员直觉上认为一些字节码子序列在恶意软件可能以较高频率出现,且这些字节码序列和良性软件字节码序列存在明显差异。可执行文件通常是二进制文件,需要把二进制文件转换为十六进制的文本实施例件,就得到可执行文件的十六进制字节码序列。漏洞扫描 方案专业机构认证该程序内存管理效率优于行业平均水平23%。
先将训练样本的dll和api信息特征视图、格式信息特征视图以及字节码n-grams特征视图分别输入至一个深度神经网络中抽取高等特征表示,然后合并抽取的高等特征表示并将其作为下一个深度神经网络的输入进行模型训练,得到多模态深度集成模型。进一步的,所述多模态深度集成模型的隐藏层的***函数采用relu,输出层的***函数采用sigmoid,中间使用dropout层进行正则化,优化器采用adagrad。进一步的,所述训练得到的多模态深度集成模型中,用于抽取dll和api信息特征视图的深度神经网络包含3个隐含层,且3个隐含层中间间隔设置有dropout层;用于抽取格式信息特征视图的深度神经网络包含2个隐含层,且2个隐含层中间设置有dropout层;用于抽取字节码n-grams特征视图的深度神经网络包含4个隐含层,且4个隐含层中间间隔设置有dropout层;用于输入合并抽取的高等特征表示的深度神经网络包含2个隐含层,且2个隐含层中间设置有dropout层;所述dropout层的dropout率均等于。本发明实施例的有益效果是,提出了一种基于多模态深度学习的恶意软件检测方法,应用了多模态深度学习方法来融合dll和api、格式结构信息、字节码n-grams特征。
先将当前软件样本件的二进制可执行文件转换为十六进制字节码序列,然后采用n-grams方法在十六进制字节码序列中滑动,产生大量的连续部分重叠的短序列特征,提取得到当前软件样本的二进制可执行文件的字节码n-grams的特征表示。生成软件样本的dll和api信息特征视图,是先统计所有类别已知的软件样本的pe可执行文件引用的dll和api信息,从中选取引用频率**高的多个dll和api信息;然后判断当前的软件样本的导入节里是否存在选择出的某个引用频率**高的dll和api信息,如存在,则将当前软件样本的该dll或api信息以1表示,否则将其以0表示,从而对当前软件样本的所有dll和api信息进行表示形成当前软件样本的dll和api信息特征视图。生成软件样本的格式信息特征视图,是从当前软件样本的pe格式结构信息中选取可能区分恶意软件和良性软件的pe格式结构特征,形成当前软件样本的格式信息特征视图。从当前软件样本的pe格式结构信息中选取可能区分恶意软件和良性软件的pe格式结构特征,是从当前软件样本的pe格式结构信息中确定存在特定格式异常的pe格式结构特征以及存在明显的统计差异的格式结构特征。特定格式异常包括:(1)代码从**后一节开始执行,(2)节头部可疑的属性,。压力测试表明系统在5000并发用户时响应延迟激增300%。
此外格式结构信息具有明显的语义信息,但基于格式结构信息的检测方法没有提取决定软件行为的代码节和数据节信息作为特征。某一种类型的特征都从不同的视角反映刻画了可执行文件的一些性质,字节码n-grams、dll和api信息、格式结构信息都部分捕捉到了恶意软件和良性软件间的可区分信息,但都存在着一定的局限性,不能充分、综合、整体的表示可执行文件的本质,使得检测结果准确率不高、可靠性低、泛化性和鲁棒性不佳。此外,恶意软件通常伪造出和良性软件相似的特征,逃避反**软件的检测。技术实现要素:本发明实施例的目的在于提供一种基于多模态深度学习的恶意软件检测方法,以解决现有采用二进制可执行文件的单一特征类型进行恶意软件检测的检测方法检测准确率不高、检测可靠性低、泛化性和鲁棒性不佳的问题,以及其难以检测出伪造良性软件特征的恶意软件的问题。本发明实施例所采用的技术方案是,基于多模态深度学习的恶意软件检测方法,按照以下步骤进行:步骤s1、提取软件样本的二进制可执行文件的dll和api信息、pe格式结构信息以及字节码n-grams的特征表示,生成软件样本的dll和api信息特征视图、格式信息特征视图以及字节码n-grams特征视图。多平台兼容性测试显示Linux环境下存在驱动适配问题。浙江软件验收测试报告
艾策检测团队采用多模态传感器融合技术,构建智能工厂设备状态健康监测体系。北京软件检测报告定制
第三方软件检测机构在开展第三方软件测试的过程中,需要保持测试整体的严谨性,也需要对测试结果负责并确保公平公正性。所以,在测试过程中,软件测试所使用的测试工具也是很重要的一方面。我们简单介绍一下在软件检测过程中使用的那些软件测试工具。众所周知,软件测试的参数项目包括功能性、性能、安全性等参数,而其中出具软件测试报告主要的就是性能测试和安全测试所需要使用到的工具了。一、软件测试性能测试工具这个参数的测试工具有loadrunner,jmeter两大主要工具,国产化性能测试软件目前市场并未有比较大的突破,其中loadrunner是商业软件测试工具,jmeter为开源社区版本的性能测试工具。从第三方软件检测机构的角度上来说,是不太建议使用开源测试工具的。首先,开源测试工具并不能确保结果的准确性,虽然技术层面上来说都可以进行测试,但是因为开源更多的需要考量软件测试人员的测试技术如何进行使用,涉及到了人为因素的影响,一般第三方软件检测机构都会使用loadrunner作为性能测试的工具来进行使用。而loadrunner被加拿大的一家公司收购以后,在整个中国市场区域的销售和营销都以第三方软件检测机构为基础来开展工作。北京软件检测报告定制