Sapiens Aperio Veritas Engine 智慧搜尋真理引擎
S.A.V.E.將使用者上傳的文件檔案與超過數十億筆中、英網路資源(包含期刊文獻、學位論文、網站內容等)進行逐字句比對,套色標示潛在抄襲的文字,提供可能的原始出處,並迅速計算每個相似段落與比對來源重複之字數,統計全文相似度百分比。
透過嶄新技術,S.A.V.E.優化比對軟體的基礎功能和界面,新增離線加密、隱私搜尋和自動化複數文章相互比對等功能,滿足多樣使用需求。此軟體已獲得台、美專利,並實際應用於大專院校的教學現場。
提供雙重參考指標
逐字句比對來源文字的相似百分比,計算統計各段落的重複字數
精準查找、高速比對
提升對非英文字元之準確性,利用機器學習準確區辨文章中未經引註之內容
尊重原創、保障隱私
軟體不會將使用者的文件儲存進文獻資料庫,毋須擔心侵犯著作權
全新參考指標 —「最長連續拷貝字數」
MAX Continued Copied Word,MAX CCW
具體落實學倫規範 提供完善檢測指標
S.A.V.E.獨家提供「最長連續拷貝字數」,符合學界「連續抄寫他人之字句,且未註明出處」的抄襲判準,有助於解決僅使用「全文相似度百分比」的不足之處。S.A.V.E.精確計算每個相似段落與比對來源重複之字數,並標示出最長的連續拷貝段落,即使更動句子中的部分字詞,S.A.V.E.仍會計入連續拷貝,防止缺乏引用的改寫,幫助學生和教師可以更準確地評估寫作的誠信。
百分比作為單一指標的局限
相似程度高低無法表示抄襲與否。當軟體顯示10%的相似度,可能代表某段文字連續從原文複製,也可能表示散佈在不同地方的重複字詞被偵測到,這兩種情況的嚴重程度截然不同。10%的重複分布在前言、結論、參考資料等文章不同的位置,也會影響抄襲於否的判斷,因此仍需要審查者花費時間逐一檢視。
離線加密・隱私搜尋 Protective Search
S.A.V.E.的嶄新技術可將受檢測文章中的字元進行多對一、不可逆的編碼轉換,再經由高速比對演算法,與同樣方式編碼的文獻資料庫進行比對。可在隱藏原文內容的同時,保持比對的準確性。S.A.V.E.離線編碼的技術適用於內容敏感的文章或尚未發布的專利,透過加密模式,保障使用者的資訊安全。
自動化複數文章相互比對
無論是多個班級或群體的作業同時上傳,S.A.V.E.都能高效執行兩兩比對,解決大班級課程同學容易互相抄襲的問題。
一般模式
加密模式*
Interenet
跟網路上內容相互比對
單一檔案
加密過的單一檔案
Pairwise
複數檔案之間相互比對
多個檔案
加密過的多個檔案
適用於標準的比對需求,提供快速而有效的相似度分析功能。
進一步加強數據安全性,適用於處理敏感資訊。檔案需經過離線編碼,並與同樣加密過的資料庫比較,符合高標準的資訊保護需求。
涵蓋網路資源和已發表的學術文章,隨時保持動態更新,反應線上內容的變化,確保比對的全面性。
S.A.V.E.能迅速準確地處理大量文件之間的比對,使用者同時上傳複數檔案,系統自動進行快速兩兩比對,並於結果中展示檔案之間的相似度。
可接受直接貼上一段文字,或透過上傳單個檔案(PDF, DOC, XLS)、多個檔案的壓縮檔(TXT, ZIP) 檔案大小上限為100 MB,無頁數與字數限制
比對模式的靈活性使S.A.V.E.得以廣泛應用在許多領域,不同情境都能提供最有力的幫助。
有效避免內文抄襲及不當引用,確保論文原創性。
防範大班級的課堂報告或演講心得,出現同學之間相互抄襲的問題。
確保多元學習成果能真實反映學生的學習軌跡。
機構或企業的機密文件和專利內容,可在受保護的情況下進行比對,防止任何未經授權的存取。
楊立威教授接受「發現新台灣、感動心台灣」節目的邀請,分享多年投身學術倫理教育和開發文章相似度比對軟體的心路歷程。