Yapay zeka ve deepweb

0 04.11.2019 22:22

Yüzey ağının altında, günlük olarak e-postalarınızı kontrol etmek veya haber makalelerini okumak için kullandığınız internetin genel formu gizli "karanlık bir ağ" barındırır. Anonim, parola korumalı sitelere ev sahipliği yapan karanlık web, suç pazarlarının silah, uyuşturucu ve insan ticareti mağdurlarının reklam ve satışında geliştiği yerdir. Kolluk kuvvetleri bu faaliyetleri durdurmak için sürekli çalışırlar, ancak bu sitelere gönderilen kullanıcıların arkasındaki gerçek dünyadaki insanları soruşturmak ve kovuşturmak için karşılaştıkları zorluklar çok büyüktür.

MIT Lincoln Laboratory'nin Yapay Zeka Teknolojisi ve Sistemleri Grubunda bir araştırmacı olan Charlie Dagli, " Karanlık web pazarlarının pop-up doğası, katılımcılarını ve etkinliklerini takip etmeyi oldukça zorlaştırıyor" diyor. Dagli, karanlık ağ pazarlarının kapanma hızına (müşterilerinin yerine getirilmeyen siparişler için ödeme yaptıktan sonra sitenin kasıtlı olarak kapandığı için saldırıya uğradıklarını, basıldıklarını, terk edildiklerini veya “çıkış aldatmacası” olarak ayarlandıkları) ve yeni olanlar görünür. Bu pazarların kısa ömürleri, birkaç aydan birkaç yıla kadar, kullanıcılarını tanımlama çabalarını engelliyor.

Bu zorluğun üstesinden gelmek için, Lincoln Laboratory, yüzey ve karanlık web verilerini analiz etmek için yeni yazılım araçları geliştiriyor.

Bu araçlar, köstebek gibi bir problemin ortaya koyduğu faydadan yararlanıyor: bağlantı satıcıları ve alıcılar ağın birçok katmanında, yüzeyden karanlığa ve karanlık web forumlarında muhafaza ediyorlar. Dagli, "Siteler arasında bu sürekli değişim, karanlık web pazarlarının çalışma şeklinin yerleşik bir parçası" diyor.

Kullanıcılar sürekli yeni profiller oluşturuyorlar. Aynı kullanıcı adlarını siteden siteye kullanmamalarına rağmen, içerikleriyle birbirlerine sinyal göndererek bağlantılarını canlı tutuyorlar. Bu sinyaller, aynı kullanıcıya ait kişileri karanlık web forumları arasında bağlamak ve daha belirgin şekilde, karanlık web üzerindeki kişileri bir kullanıcının gerçek kimliğini ortaya çıkarmak için yüzey ağına bağlamak için kullanılabilir.

Kullanıcıları karanlık ağda bağlamak, kanun uygulayıcıların zaten yapmaya çalıştığı şeydir. Sorun şu ki, ayda 500.000 telefon numarası ve 2 milyon seks reklamı aracılığıyla el ile karıştırmaları gereken veri miktarının çok hızlı ve bağlantıları hızlı bir şekilde bulamamaları için yapılandırılmamış olması. Bu nedenle, vakaların yalnızca düşük bir yüzdesi takip edilebilir.

Kişisel bağlantı sürecini otomatikleştirmek için, Lincoln Laboratory, farklı forumlardaki kullanıcılar arasındaki benzerliği hesaplamak için makine öğrenme algoritmalarını eğitiyor. Hesaplamalar, kullanıcıların çevrimiçi iletişiminin üç yönüne dayanıyor: “Başkalarına nasıl tanımladıkları, ne hakkında yazdıkları ve kimlerle yazdıkları” diye açıklıyor Dagli.

Algoritma önce belirli bir Forum A'daki kullanıcılardan gelen verilerle beslenir ve her kullanıcı için bir yazarlık modeli oluşturur. Daha sonra, Forum B'deki kullanıcılardan gelen veriler, Forum A'daki tüm kullanıcı modellerine karşı çalıştırılır. Profil bilgisi eşleşmelerini bulmak için algoritma, Forum A'daki "sergeygork" gibi "kullanıcı adı yazılışındaki" sergey gorkin "gibi değişiklikler gibi basit ipuçlarını arar. Forum B'de veya "joe knight" gibi "joe kabusu" gibi daha fazla benzerlik.

Sistemin bir sonraki özelliği içerik benzerliğidir. Sistem, birden fazla reklamda kullanılan benzersiz ifadeleri (örneğin, "güneşte eğlence" gibi) alır. Dagli, "Bir sürü kopyala ve yapıştır işlemi oluyor, bu nedenle aynı kullanıcıdan gelen benzer ifadeler ortaya çıkacak" diyor. Sistem daha sonra bir kullanıcının ağında, kullanıcının etkileşimde bulunduğu insan çemberi ve kullanıcı ağının tartışıldığı konular arasındaki benzerlikleri arar.

Profil, içerik ve ağ özellikleri daha sonra tek bir çıktı elde etmek için kaynaştırılır: iki forumdan iki kişinin aynı gerçek kişiyi temsil ettiği olasılık puanı.

Araştırmacılar, bu kişisel bağlantı algoritmalarını hem açık kaynaklı Twitter hem de Instagram verileriyle ve karanlık web forumlarındaki elle etiketlenmiş temel gerçek verileriyle test ediyorlar. Bu çalışmada kullanılan verilerin tamamı yetkili araçlarla elde edilmiştir. Sonuçlar umut verici. Dagli, "Her ne zaman bir eşleşme rapor edersek, zamanın yüzde 95'inde haklıyız. Sistem, literatürde bulabileceğimiz en iyi bağlantı sistemlerinden biri." Diyor.

Bu çalışma devam eden araştırmalarda en son gelişmedir. Lincoln Laboratuvarı, 2014 - 2017 yılları arasında Savunma Gelişmiş Araştırma Projeleri Ajansı (DARPA) Memex programına katkıda bulundu. Memex, onlarca üniversite, ulusal laboratuvar ve şirket ile işbirliği içinde geliştirilen bir dizi yüzey ve karanlık web veri analizi yazılımı ile sonuçlandı. Memex için yaratılan metin, konuşma ve görsel analitiği kapsayan on adet laboratuvar teknolojisi, DARPA Açık Katalog aracılığıyla açık kaynaklı yazılım olarak piyasaya sürüldü.

Bugün, dünya çapında 30'dan fazla kurum, araştırma yapmak için Memex yazılımını kullanıyor. En büyük kullanıcılardan biri ve Memex'in gelişimindeki paydaşlardan biri, Manhattan Bölge Savcılığındaki İnsan Kaçakçılığı Müdahale Birimi (HTRU).

Manhattan Bölge Savcısı Cyrus Vance Jr. , ABD Temsilciler Meclisi'nin yazılı bir ifadesinde , ofisinin yalnızca 2017'de insan kaçakçılığı belirtileri için 6.000'den fazla tutuklama taraması yapmak için Memex araçlarını kullandığını belirtti. "Ayrıca, 271 insan kaçakçılığı soruşturmasında ve 2017'de getirilen altı yeni seks kaçakçılığı iddianamesinde de Memex kullandık" dedi. Memex’in tanıtılmasıyla HTRU’nun insan kaçakçılığı göstergelerinde gösterdiği fuhuş tutuklamaları yüzde 5’ten yüzde 62’ye yükseldi ve New York Polis Departmanı fuhuşla ilgili tutuklamaların soruşturması yılda 15 ila 300 arttı.

HTRU genel başkan yardımcısı Jennifer Dolle, ünitenin bu teknolojilerden nasıl faydalandığını sunmak için laboratuarı ziyaret etti. "Bu araçları her gün kullanıyoruz. Ofisimizde iş yapma biçimimizi gerçekten değiştirdiler" diyor Dolle, Memex'ten önce bir insan kaçakçılığı soruşturmasının çok daha uzun zaman alabileceğini söyledi.

Şimdi, Memex araçları HTRU'nun yeni ortaya çıkan vakaları hızlı bir şekilde iyileştirmesini ve az miktarda bilgiye sahip olan müşteri adaylarından seks kaçakçılığı araştırmaları yapmasını sağlıyor. Örneğin, seks reklam verilerini endekslemek, özetlemek ve aramak için TellFinder (Memex katkısı Uncharted Software tarafından oluşturulmuş) olarak adlandırılanlar da dahil olmak üzere bu araçlar, tek bir çevrimiçi fuhuş reklamındaki verilerden gelen reşit olmayan mağdurları tanımlamak için kullanılmıştır. Dolle, "Bu ilave soruşturmacılar, HTRU 'nun insan tacirlerini şiddetli suç suçlamaları ile kovuşturmalarına ve bu sanıkları savunmasız mağdurlara karşı işledikleri suçların gerçekliğinden sorumlu tutmalarına izin veriyor" dedi.

Araştırmacılar, ortaya çıkan teknolojilerin kurumların neye ihtiyaç duyduğuna ve karanlık ağın nasıl işlediğine göre uyarlanabileceğini öğrenmeye devam ediyor. "Veriye dayalı makine öğrenimi, karanlık web'deki yasadışı çevrimiçi pazarlarla mücadele etmek için kanun uygulayıcılar için çok önemli bir araç haline geldi" diyor ve laboratuvarın finanse ettiği İnsan Dinamik Karanlık Ağlar programındaki sürekli çalışmanın baş araştırmacısı Lin Li Laboratuvarın Teknoloji Ofisi. “Ancak devam etmekte olan zorluklardan ve araştırma alanlarından bazıları talep ekonomisi anlayışımızı genişletmek, arz ekonomisini bozmak ve daha iyi bir genel durumsal farkındalık kazanmaktır.”

Karanlık web ekonomisinin arz-talep zincirlerinin nasıl çalıştığını daha iyi anlamak, ekibin bu zincirleri bozacak teknolojiler geliştirmesine yardımcı olacaktır. Hedefin bir kısmı da bu yasadışı ekonomiye katılma riskini arttırmak; karanlık ağdaki kişiyi yüzey ağındaki kişilere bağlamak potansiyel olarak güçlü bir taktiktir.

Yapay Zeka Teknolojisi Lideri Joseph Campbell, "Bu hızla büyüyen yasadışı ekonomi, terör faaliyetlerini finanse etmek için DARPA tarafından gösterildi ve HTRU tarafından günümüz köleliğinin itici gücü olarak gösterildi. Terörizmin mağlup edilmesi ve köleliğin ortadan kaldırılması ulusal ve insani ihtiyaçlar," diyor. ve Sistem Grubu. “Grubumuz AI, makine öğrenimi ve çok dilli konuşma, metin ve videodan ağ iletişimi ve etkinlikleriyle bir araya getirilen bilgilere dayanan insan ağlarının analizinde olağanüstü bir uzmanlığa sahiptir. gelişir ve ilerler, bu ulusal ve insani ihtiyaçlar için muazzam etkiyle günlük olarak kullanan sponsorlarımıza aktarılır.