發(fā)貨地點(diǎn):廣東省深圳市
發(fā)布時(shí)間:2025-04-23
并將測試樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖輸入步驟s2訓(xùn)練得到的多模態(tài)深度集成模型中,對測試樣本進(jìn)行檢測并得出檢測結(jié)果。實(shí)驗(yàn)結(jié)果與分析(1)樣本數(shù)據(jù)集選取實(shí)驗(yàn)評估使用了不同時(shí)期的惡意軟件和良性軟件樣本,包含了7871個(gè)良性軟件樣本和8269個(gè)惡意軟件樣本,其中4103個(gè)惡意軟件樣本是2011年以前發(fā)現(xiàn)的,4166個(gè)惡意軟件樣本是近年來新發(fā)現(xiàn)的;3918個(gè)良性軟件樣本是從全新安裝的windowsxpsp3系統(tǒng)中收集的,3953個(gè)良性軟件樣本是從全新安裝的32位windows7系統(tǒng)中收集的。所有的惡意軟件樣本都是從vxheavens網(wǎng)站中收集的,所有的樣本格式都是windowspe格式的,樣本數(shù)據(jù)集構(gòu)成如表1所示。表1樣本數(shù)據(jù)集類別惡意軟件樣本良性軟件樣本早期樣本41033918近期樣本41663953合計(jì)82697871(2)評價(jià)指標(biāo)及方法分類性能主要用兩個(gè)指標(biāo)來評估:準(zhǔn)確率和對數(shù)損失。準(zhǔn)確率測量所有預(yù)測中正確預(yù)測的樣本占總樣本的比例,*憑準(zhǔn)確率通常不足以評估預(yù)測的魯棒性,因此還需要使用對數(shù)損失。對數(shù)損失(logarithmicloss),也稱交叉熵?fù)p失(cross-entropyloss),是在概率估計(jì)上定義的,用于測量預(yù)測類別與真實(shí)類別之間的差距大小。安全掃描確認(rèn)軟件通過ISO 27001標(biāo)準(zhǔn),無高危漏洞記錄。上海軟件測試服務(wù)
12)把節(jié)裝入到vmm的地址空間;(13)可選頭部的sizeofcode域取值不正確;(14)含有可疑標(biāo)志。此外,惡意軟件和良性軟件間以下格式特征也存在明顯的統(tǒng)計(jì)差異:(1)證書表是軟件廠商的可認(rèn)證的聲明,惡意軟件很少有證書表,而良性軟件大部分都有軟件廠商可認(rèn)證的聲明;(2)惡意軟件的調(diào)試數(shù)據(jù)也明顯小于正常文件的,這是因?yàn)閻阂廛浖䴙榱嗽黾诱{(diào)試的難度,很少有調(diào)試數(shù)據(jù);(3)惡意軟件4個(gè)節(jié)(.text、.rsrc、.reloc和.rdata)的characteristics屬性和良性軟件的也有明顯差異,characteristics屬性通常**該節(jié)是否可讀、可寫、可執(zhí)行等,部分惡意軟件的代碼節(jié)存在可寫異常,只讀數(shù)據(jù)節(jié)和資源節(jié)存在可寫、可執(zhí)行異常等;(4)惡意軟件資源節(jié)的資源個(gè)數(shù)也明顯少于良性軟件的,如消息表、組圖表、版本資源等,這是因?yàn)閻阂廛浖苌偈褂脠D形界面資源,也很少有版本信息。pe文件很多格式屬性沒有強(qiáng)制限制,文件完整性約束松散,存在著較多的冗余屬性和冗余空間,為pe格式惡意軟件的傳播和隱藏創(chuàng)造了條件。此外,由于惡意軟件為了方便傳播和隱藏,盡一切可能的減小文件大小,文件結(jié)構(gòu)的某些部分重疊,同時(shí)對一些屬性進(jìn)行了特別設(shè)置以達(dá)到anti-dump、anti-debug或抗反匯編。天津軟件檢測報(bào)告策科技助力教育行業(yè):數(shù)字化教學(xué)的創(chuàng)新應(yīng)用 。
先將當(dāng)前軟件樣本件的二進(jìn)制可執(zhí)行文件轉(zhuǎn)換為十六進(jìn)制字節(jié)碼序列,然后采用n-grams方法在十六進(jìn)制字節(jié)碼序列中滑動(dòng),產(chǎn)生大量的連續(xù)部分重疊的短序列特征,提取得到當(dāng)前軟件樣本的二進(jìn)制可執(zhí)行文件的字節(jié)碼n-grams的特征表示。生成軟件樣本的dll和api信息特征視圖,是先統(tǒng)計(jì)所有類別已知的軟件樣本的pe可執(zhí)行文件引用的dll和api信息,從中選取引用頻率**高的多個(gè)dll和api信息;然后判斷當(dāng)前的軟件樣本的導(dǎo)入節(jié)里是否存在選擇出的某個(gè)引用頻率**高的dll和api信息,如存在,則將當(dāng)前軟件樣本的該dll或api信息以1表示,否則將其以0表示,從而對當(dāng)前軟件樣本的所有dll和api信息進(jìn)行表示形成當(dāng)前軟件樣本的dll和api信息特征視圖。生成軟件樣本的格式信息特征視圖,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,形成當(dāng)前軟件樣本的格式信息特征視圖。從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中確定存在特定格式異常的pe格式結(jié)構(gòu)特征以及存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征。特定格式異常包括:(1)代碼從**后一節(jié)開始執(zhí)行,(2)節(jié)頭部可疑的屬性,。
特征之間存在部分重疊,但特征類型間存在著互補(bǔ),融合這些不同抽象層次的特征可更好的識(shí)別軟件的真正性質(zhì)。且惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測,但惡意軟件很難同時(shí)偽造多個(gè)抽象層次的特征逃避檢測;谠撚^點(diǎn),本發(fā)明實(shí)施例提出一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測方法,以實(shí)現(xiàn)對惡意軟件的有效檢測,提取了三種模態(tài)的特征(dll和api信息、pe格式結(jié)構(gòu)信息和字節(jié)碼3-grams),提出了通過前端融合、后端融合和中間融合這三種融合方式集成三種模態(tài)的特征,有效提高惡意軟件檢測的準(zhǔn)確率和魯棒性,具體步驟如下:步驟s1、提取軟件樣本的二進(jìn)制可執(zhí)行文件的dll和api信息、pe格式結(jié)構(gòu)信息以及字節(jié)碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖;統(tǒng)計(jì)當(dāng)前軟件樣本的導(dǎo)入節(jié)中引用的dll和api,提取得到當(dāng)前軟件樣本的二進(jìn)制可執(zhí)行文件的dll和api信息的特征表示。對當(dāng)前軟件樣本的二進(jìn)制可執(zhí)行文件進(jìn)行格式結(jié)構(gòu)解析,并按照格式規(guī)范提取**該軟件樣本的格式結(jié)構(gòu)信息,得到該軟件樣本的二進(jìn)制可執(zhí)行文件的pe格式結(jié)構(gòu)信息的特征表示。艾策科技:如何用數(shù)據(jù)分析重塑企業(yè)決策!
在數(shù)字化轉(zhuǎn)型加速的,軟件檢測公司已成為保障各行業(yè)信息化系統(tǒng)穩(wěn)定運(yùn)行的力量。深圳艾策信息科技有限公司作為國內(nèi)軟件檢測公司領(lǐng)域的企業(yè),始終以技術(shù)創(chuàng)新為驅(qū)動(dòng)力,深耕電力能源、科研教育、政企單位、研發(fā)科技及醫(yī)療機(jī)構(gòu)等垂直場景,為客戶提供從需求分析到運(yùn)維優(yōu)化的全鏈條質(zhì)量保障服務(wù)。以專業(yè)能力筑牢行業(yè)壁壘作為專注于軟件檢測的技術(shù)型企業(yè),艾策科技通過AI驅(qū)動(dòng)的智能檢測平臺(tái),實(shí)現(xiàn)了測試流程的自動(dòng)化、化與智能化。其產(chǎn)品一一軟件檢測系統(tǒng),整合漏洞掃描、壓力測試、合規(guī)性驗(yàn)證等20余項(xiàng)功能模塊,可快速定位代碼缺陷、性能瓶頸及安全風(fēng)險(xiǎn),幫助客戶將軟件故障率降低60%以上。針對電力能源行業(yè),艾策科技開發(fā)了電網(wǎng)調(diào)度系統(tǒng)專項(xiàng)檢測方案,成功保障某省級電力公司百萬級用戶數(shù)據(jù)安全;在科研教育領(lǐng)域,其實(shí)驗(yàn)室管理軟件檢測服務(wù)覆蓋全國50余所高校,助力科研數(shù)據(jù)存儲(chǔ)與分析的合規(guī)性升級。此外,公司為政企單位政務(wù)云平臺(tái)、研發(fā)科技企業(yè)創(chuàng)新產(chǎn)品、醫(yī)療機(jī)構(gòu)智慧醫(yī)療系統(tǒng)提供的定制化檢測服務(wù),均獲得客戶高度認(rèn)可。差異化服務(wù)塑造行業(yè)作為軟件檢測公司,艾策科技突破傳統(tǒng)檢測模式,推出“檢測+培訓(xùn)+咨詢”一體化服務(wù)體系。通過定期發(fā)布行業(yè)安全白皮書、舉辦技術(shù)研討會(huì)。用戶體驗(yàn)測評中界面交互評分低于同類產(chǎn)品均值15.6%。哈爾濱 軟件第三方測試
負(fù)載測試證實(shí)系統(tǒng)最大承載量較宣傳數(shù)據(jù)低18%。上海軟件測試服務(wù)
將訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖輸入深度神經(jīng)網(wǎng)絡(luò),訓(xùn)練多模態(tài)深度集成模型;(1)方案一:采用前端融合(early-fusion)方法,首先合并訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖的特征,融合成一個(gè)單一的特征向量空間,然后將其作為深度神經(jīng)網(wǎng)絡(luò)模型的輸入,訓(xùn)練多模態(tài)深度集成模型;(2)方案二:首先利用訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖分別訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型,合并訓(xùn)練的三個(gè)深度神經(jīng)網(wǎng)絡(luò)模型的決策輸出,并將其作為感知機(jī)的輸入,訓(xùn)練得到**終的多模態(tài)深度集成模型;(3)方案三:采用中間融合(intermediate-fusion)方法,首先使用三個(gè)深度神經(jīng)網(wǎng)絡(luò)分別學(xué)習(xí)訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖的高等特征表示,并合并學(xué)習(xí)得到的訓(xùn)練樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖的高等特征表示融合成一個(gè)單一的特征向量空間,然后將其作為下一個(gè)深度神經(jīng)網(wǎng)絡(luò)的輸入,訓(xùn)練得到多模態(tài)深度神經(jīng)網(wǎng)絡(luò)模型。步驟s3、將軟件樣本中的類別未知的軟件樣本作為測試樣本。上海軟件測試服務(wù)