تقليد صوت المستخدم خطر أمني يخدع الآلات والإنسان على حد سواء
وجد باحثون من جامعة ألباما في بيرمينغهام أن آلية التحقق البشرية والآلية والخاصة بأنظمة كشف الهوية اعتماداً على صوت المستخدم عرضةٌ للاختراق عبر انتحال صوت المستخدم، وفقاً لبحث نُشر في 26 سبتمبر 2015.
وباستعمال أداة لتركيب الصوت المتوفرة في الأسواق والمتاحة للجميع، نجح الباحثون في تنفيذ هجوم عبر انتحال للصوت وتمكنوا من اختراق أنظمة كشف الهويةالآلية والبشرية على حد سواء.
يقول البروفسور نيتش ساكسينا زميل في مجال علوم الحاسوب والمعلومات في جامعة ألباما في برمنغهام،ومدير قسم الأمن والخصوصية في مختبر أنظمة الشبكات والحوسبة الحديثة(SPIES) :"إن صوت الإنسان جزءٌ لا يتجزأ من نشاطه اليومي، فهو يمّكن الناس من التواصل عن قرب، وعن بعد أيضاً في مواقع شتى عبر استعمال أجهزة الراديو والهاتف، أو من خلال الإنترنت عبر استعمال الوسائط الرقمية، وبما أن الناس يعتمدون على استعمال أصواتهم في جميع الأوقات، أصبح ذلك ممارسة مريحة لا ضير فيها" ويضيف قائلاً : "إن الأمر الذي لا يدركونه هو أن ميلهم لهذا المستوى من الراحة يجعل أصواتهم سلعة سهلة، فالناس غالباً ما تترك آثاراً تقود لأصواتها من خلال سيناريوهات كثيرة متنوعة، مثل التحدث بصوتٍ عالٍ في المطعم أو عند تقديم أي عروض عامة أو إجراء مكالمات هاتفية أو عند ترك أي نماذج الكترونية عبر الشبكة".
ويوضح قائلاً : " بإمكان أي شخص يُضمر أي نوايا خبيثة أن يسجل صوت أي إنسان إن كان قريباً من المتحدث، وذلك عن طريق إجراء مكالمة وهمية أو عن طريق البحث والتنقيب عن مقاطع مرئية عبر الشبكة أو حتى عن طريق تكوين مُخدمات في سحابة الكترونية تعمل على تخزين تلك المعلومات الصوتية ".
وتوضح هذه الدراسة الواردة من كلية قسم الفنون والعلوم الإنسانية في جامعة ألباما في برمنغهام ومركز ضبط المعلومات وبحث الأدلة الجنائية المشترك كيف أن أي معتدي يتمكن من الحصول على أي نماذج صوتية من صوت الضحية بوسعه أن يعرض أمن الضحية وسلامته وخصوصيته للخطر.
إن عمليات التحديث في مجال التكنولوجيا وبالتحديد تلك المرتبطة بتركيب الكلام المؤتمت (automate speech synthesis) أي تركيب الصوت بواسطة برامج الكمبيوتر تسمح لأي معتدي أن ينشىء نموذج مشابه لصوت الضحية من خلال عدد محدود من النماذج، وبالإمكان استعمال هذه التقنية من أجل تحويل صوت المعتدي إلى رسالة صوتية تصدر بصوت الضحية.
"نتيجة لذلك قد تكون بضع دقائق فقط من صوت الضحية الأصلي الذي يمكن التقاطه وتسجيله في الأماكن العامة مثلاً أو في أي مناسبة أخرى السبب وراء هذه الكارثة." حسب قول ساكسينا. "قد تكون عواقب عملية النسخ هذه هائلة، لأن الصوت خاصية فريدة من نوعها يتمتع بها كل شخص، فهي تُشكل أساس التحقق من أي شخص، وهذا يمنح المعتدي المفاتيح إلى خصوصية ذلك الشخص."
وفي دراسة مفصلة ملحقة بهذا البحث ، تحقق الباحثون من عواقب سرقة الأصوات عبر استعمالها في مجالين ومساقين مهمين يعتمدان على الأصوات كأساس لعملية التحقق من الهوية وهما:
أولاً: المقاييس الحيوية الصوتية التي توفر امكانية التحقق من هوية المتكلم، وهو نظام يستعمل ميزات فريدة مرتبطة بصوت الفرد للتحقق من هويته.
وقد أصبحت المقاييس الحيوية الصوتية هي المصطلح الرائج حديثاً في البنوك وشركات البطاقات الائتمانية، ويسعى كثيرٌ من البنوك وشركات البطاقات الائتمانية إلى منح مستخدميهم خبرة خالية من المشاكل في استعمال خدماتهم عن طريق الدخول إلى حساباتهم من خلال استعمال المقاييس الحيوية الصوتية.
ويتم استخدام هذه التقنية أيضاً في الأجهزة الذكية كبديل لأقفال "رقم التعريف الشخصي (PIN)" التقليدية، وقد استعملت في كثير من المؤسسات الحكومية لغرض تشييد نظام دخول آمن للمباني.
وتقوم المقاييس الحيوية الصوتية على افتراض أن كل شخص يتمتع بصوت مميز، لا يعتمد فقط على الميزات الفيزيولوجية للحبال الصوتية، بل على شكل الجسم ككل، وطريقة تشكيل الصوت وانتشاره.
وعند تمكن المعتدي من التغلب على المقاييس الحيوية الصوتية عن طريق استعمال أصوات مقلدة، فإنه يتمتع بحق الدخول غير المقيد إلى النظام، والذي قد يكون جهاز أو خدمة، وذلك عبر توظيف ميزة التحقق من الهوية عبر الصوت.
ثانياً : قام فريق البحث بدراسة مضاعفات سرقة الأصوات التي تتركها على أنواع التواصل بين البشر، وقد قلدت أداة تركيب الصوت صوت اثنين من المشاهير وهما ( اوبرا وينفري ) و( مورغان فريمان) وذلك ضمن بيئة الدراسة التي تم اختيارها بعناية، وتمكنوا من النجاح .
وقد تبين إنه في حال تمكن المعتدي من تقليد صوت الضحية، فإن أمن المحادثات بعيدة المدى قد يتعرض للخطر، وبإمكان المعتدي أن يجعل نظام تركيب الصوت يتحدث لوحده بأي شيء يُريده المعتدي، وذلك بنبرة صوت الضحية وطريقة تحدثه، وبإمكانه إطلاق هجوم قد يلحق الضرر بسمعة الضحية أو أمنه وسلامة الناس حوله.
وقد أظهرت النتائج أن الخوارزميات الحديثة المؤتمتة كانت غير فعالة على نطاق واسع بالنسبة إلى الاعتداءات التي طورها فريق البحث، حيث كان متوسط الأصوات المقلدة المرفوضة أقل من 10 إلى 20 بالمائة بالنسبة إلى معظم الضحايا، فضلاً عن أن ميزة التحقق من صوت الإنسان كانت عرضةً إلى الاعتداءات.
وفي حين أن نتائج هذه الدراسة تبين مقدار إمكانية تعرض أي شخص إلى الاعتداءات عبر الصوت، إلا أن هناك طرق لحماية صوت الإنسان من السرقة، ويقترح ساكسينا أن يزيد الناس من وعيهم لاحتمالية حصول هذه الاعتداءات، وأن يتجنبوا قدر المستطاع نشر أي مقاطع تحتوي على أصواتهم عبر الشبكة.