先將當前軟件樣本件的二進制可執行文件轉換為十六進制字節碼序列,然后采用n-grams方法在十六進制字節碼序列中滑動,產生大量的連續部分重疊的短序列特征,提取得到當前軟件樣本的二進制可執行文件的字節碼n-grams的特征表示。生成軟件樣本的dll和api信息特征視圖,是先統計所有類別已知的軟件樣本的pe可執行文件引用的dll和api信息,從中選取引用頻率**高的多個dll和api信息;然后判斷當前的軟件樣本的導入節里是否存在選擇出的某個引用頻率**高的dll和api信息,如存在,則將當前軟件樣本的該dll或api信息以1表示,否則將其以0表示,從而對當前軟件樣本的所有dll和api信息進行表示形成當前軟件樣本的dll和api信息特征視圖。生成軟件樣本的格式信息特征視圖,是從當前軟件樣本的pe格式結構信息中選取可能區分惡意軟件和良性軟件的pe格式結構特征,形成當前軟件樣本的格式信息特征視圖。從當前軟件樣本的pe格式結構信息中選取可能區分惡意軟件和良性軟件的pe格式結構特征,是從當前軟件樣本的pe格式結構信息中確定存在特定格式異常的pe格式結構特征以及存在明顯的統計差異的格式結構特征。特定格式異常包括:(1)代碼從**后一節開始執行,(2)節頭部可疑的屬性,。第三方驗證實際啟動速度較廠商宣稱慢0.7秒。軟件系統安全滲透測試
幫助客戶提升內部技術團隊能力。例如,某三甲醫院在采用艾策科技的醫療信息化系統檢測方案后,不僅系統漏洞率下降45%,其IT團隊的安全意識與應急響應能力也提升。技術創新未來方向艾策科技創始人兼CTO表示:“作為軟件檢測公司,我們始終將技術創新視為競爭力。未來,公司將重點投入AI算法優化、邊緣計算檢測等前沿領域,為電力能源、政企單位等行業提供更高效、更智能的質量保障服務。”深圳艾策信息科技有限公司是一家立足于粵港澳大灣區,依托信息技術產業,面向全國客戶提供專業、可靠服務的第三方CMACNAS檢測機構。在檢測服務過程中,公司始終堅持以客戶需求為本,秉承公平公正的第三方檢測要求,遵循國家檢測標準規范,確保檢測數據和結果準確可靠,運用前沿A人工智能技術提高檢測效率。我們追求創造優異的社會價值,我們致力于打造公司成為第三方檢測行業的行業榜樣。軟件可靠性測評報告收費多平臺兼容性測試顯示Linux環境下存在驅動適配問題。
3)pe可選頭部有效尺寸的值不正確,(4)節之間的“間縫”,(5)可疑的代碼重定向,(6)可疑的代碼節名稱,(7)可疑的頭部***,(8)來自,(9)導入地址表被修改,(10)多個pe頭部,(11)可疑的重定位信息,(12)把節裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,(14)含有可疑標志。存在明顯的統計差異的格式結構特征包括:(1)無證書表;(2)調試數據明顯小于正常文件,(3).text、.rsrc、.reloc和.rdata的characteristics屬性異常,(4)資源節的資源個數少于正常文件。生成軟件樣本的字節碼n-grams特征視圖,是統計了每個短序列特征的詞頻(termfrequency,tf),即該短序列特征在軟件樣本中出現的頻率。先從當前軟件樣本的所有短序列特征中選取詞頻tf**高的多個短序列特征;然后計算選取的每個短序列特征的逆向文件頻率idf與詞頻tf的乘積,并將其作為選取的每個短序列特征的特征值,,表示該短序列特征表示其所在軟件樣本的能力越強;**后在選取的詞頻tf**高的多個短序列特征中選取,生成字節碼n-grams特征視圖。:=tf×idf;tf(termfrequency)是詞頻,定義如下:其中,ni,j是短序列特征i在軟件樣本j中出現的次數,∑knk,j指軟件樣本j中所有短序列特征出現的次數之和。
此外格式結構信息具有明顯的語義信息,但基于格式結構信息的檢測方法沒有提取決定軟件行為的代碼節和數據節信息作為特征。某一種類型的特征都從不同的視角反映刻畫了可執行文件的一些性質,字節碼n-grams、dll和api信息、格式結構信息都部分捕捉到了惡意軟件和良性軟件間的可區分信息,但都存在著一定的局限性,不能充分、綜合、整體的表示可執行文件的本質,使得檢測結果準確率不高、可靠性低、泛化性和魯棒性不佳。此外,惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測。技術實現要素:本發明實施例的目的在于提供一種基于多模態深度學習的惡意軟件檢測方法,以解決現有采用二進制可執行文件的單一特征類型進行惡意軟件檢測的檢測方法檢測準確率不高、檢測可靠性低、泛化性和魯棒性不佳的問題,以及其難以檢測出偽造良性軟件特征的惡意軟件的問題。本發明實施例所采用的技術方案是,基于多模態深度學習的惡意軟件檢測方法,按照以下步驟進行:步驟s1、提取軟件樣本的二進制可執行文件的dll和api信息、pe格式結構信息以及字節碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節碼n-grams特征視圖。代碼質量評估顯示注釋覆蓋率不足30%需加強。
等價類劃分法將不能窮舉的測試過程進行合理分類,從而保證設計出來的測試用例具有完整性和**性。有數據輸入的地方,可以使用等價類劃分法。從大量數據中挑選少量**數據進行測試有效等價類:符合需求規格說明書規定的數據用來測試功能是否正確實現無效等價類:不合理的輸入數據**—用來測試程序是否有強大的異常處理能力(健壯性)使用**少的測試數據,達到**好的測試質量邊界值分析法對輸入或輸出的邊界值進行測試的一種黑盒測試方法。是作為對等價類劃分法的補充,這種情況下,其測試用例來自等價類的邊界。邊界點1、邊界是指相對于輸入等價類和輸出等價類而言,稍高于、稍低于其邊界值的一些特定情況。2、邊界點分為上點、內點和離點。如果是范圍[1,100]需要選擇0,1,2,50,99,100,101如果是個數**多20個[0,20]需要測0,10,20,-1,21因果圖分析法用畫圖的方式表達輸入條件和輸出結果之間的關系。1恒等2與3或4非5互斥1個或者不選6***必須是1個7包含可以多選不能不選8要求如果a=1,則要求b必須是1,反之如果a=0時,b的值無所謂9**關系當a=1時,要求b必須為0;而當a=0時。從傳統到智能:艾策科技助力制造業升級之路。軟件開發的安全評測
人工智能在金融領域的應用:艾策科技的實踐案例。軟件系統安全滲透測試
每一種信息的來源或者形式,都可以稱為一種模態。例如,人有觸覺,聽覺,視覺,嗅覺。多模態機器學習旨在通過機器學習的方法實現處理和理解多源模態信息的能力。多模態學習從1970年代起步,經歷了幾個發展階段,在2010年后***步入深度學習(deeplearning)階段。在某種意義上,深度學習可以被看作是允許我們“混合和匹配”不同模型以創建復雜的深度多模態模型。目前,多模態數據融合主要有三種融合方式:前端融合(early-fusion)即數據水平融合(data-levelfusion)、后端融合(late-fusion)即決策水平融合(decision-levelfusion)以及中間融合(intermediate-fusion)。前端融合將多個**的數據集融合成一個單一的特征向量空間,然后將其用作機器學習算法的輸入,訓練機器學習模型,如圖1所示。由于多模態數據的前端融合往往無法充分利用多個模態數據間的互補性,且前端融合的原始數據通常包含大量的冗余信息。因此,多模態前端融合方法常常與特征提取方法相結合以剔除冗余信息,基于領域經驗從每個模態中提取更高等別的特征表示,或者應用深度學習算法直接學習特征表示,然后在特性級別上進行融合。后端融合則是將不同模態數據分別訓練好的分類器輸出決策進行融合,如圖2所示。軟件系統安全滲透測試