2018年大鐸與國內金融機構合作以專案合作模式,將TTS全文檢索引擎擴充導入AML NC需求,開發了洗錢防制查名系統AML/NC與SWIFT/NC電文黑名單檢索系統,並於2020年完成上線。
大鐸導入文字處理技術的NC已經突破國內外查名系統的困境:
大鐸的NC系統是基於專業檢索引擎的文字處理能力,無論是中西文字變化或日期缺漏,大鐸NC系統均能經由一步到位的運算得到精確的結果:
文字檢索引擎天生就是以字為處理單位,經過超過30年的持續擴展,NC的各項中文要求及西文的專業功能已達到極致,導入西文容錯及日期容錯,就可以完整達到黑名單查找的嚴苛要求。
大鐸NC基於成熟可靠的檢索引擎,經由掌握黑名單內容的每一個字,擴充容錯演算功能,整體功能極可靠且查名結果準確度高,可以滿足現在及未來的功能需求。
A. 2021/07/21 發明專利:黑名單資料庫檢索系統
B. 2021/11/01 新型專利:於文件中快速查找預設名單
內容性功能有容錯展開依據,黑名單字典隨時更新並與檢索引擎結合,功能依據內容而生。
事前將檢索條件依黑名單字典作容錯展開後再查找。
容錯展開可能會將條件展成極大的條件值,對應用者壓力很大,但將之植入引擎內核,只要將一般的條件送入檢索引擎,檢索引擎就可以自動逐一展開處理,在資料讀取時自動標示命中處。
A. 中文容錯:繁簡透通、異體字、贅字、中文拼音、四角號碼、同義字、前後順序變化。
B. 西文容錯:前後順序變化、大小寫、全半型、特殊符號、贅字、重複空白、名字相連、字形變化、截尾、字元位移、字元容錯。
C. 日期容錯:指定日期、年範圍、不知查詢:資料本身缺漏,亦可以找到。
黑名單資料以「字」為單位預先建成索引,在索引中每個字有4個整數記錄所在位置,查名演算就是作位置鄰近計算。
黑名單的字索引總數超過1億1,000萬字(中文1,300萬字,西文9,000萬字,數字700萬字,日期索引超過500萬),大鐸系統承載過2,500億字的資料庫。
在實體電腦主機上,索引運算可達每秒6,000萬個以上。
在擁有容量與運算優勢下,可以預先將查詢條件的變化擴展至十倍甚至數百倍,再經由高速運算,一步到位找出所有可能。
銀行對於客戶地址有結構化及非結構化的儲存格式,但兩者皆有找尋上的困難。地址查找即使應用專業檢索引擎也沒幫助,因此一般地址查找往往需要大量的讀取與過濾,即便如此,也未必能有效找到全部符合的地址。
地址著錄之「縣丶市丶區丶鄉丶鎮丶村丶里丶鄰丶路丶段丶街丶巷丶弄丶號丶樓丶室丶之丶棟」等,單位難以拆分或不完整,甚至有 "壹佰貳拾參號"丶"一百二十三號"丶"一百廿三號"丶"123號"丶"123号" 等等各式寫法,使得查找不準確或不完整。
大鐸的地址查找可在1/100秒內,於1000萬個以上的地址中,準確的找到完整的地址資料。