Cloudflare กล่าวหาว่าน่างงงวยในการหลบเลี่ยงข้อ จำกัด ของบอท

CloudFlare ได้กล่าวหาว่า Perplexity AI ในการใช้งานโปรแกรมรวบรวมข้อมูลเว็บที่ซ่อนเร้นและไม่ได้ประกาศเพื่อข้ามข้อ จำกัด ของบอทมาตรฐานที่กำหนดโดยเว็บไซต์ ในการโพสต์บล็อกโดยละเอียด CloudFlare กล่าวหาว่า Perplexity ไม่เพียง แต่เพิกเฉยต่อคำสั่ง robots.txt แต่ยังใช้ช่วง IP สำรองและตัวแทนผู้ใช้ที่ปิดบังเพื่อปกปิดกิจกรรมของโครงสร้างพื้นฐานการทำให้เว็บ

จุดสนใจของการกล่าวหาคือความงุนงงกำลังหลีกเลี่ยงมาตรฐานเว็บทั่วไปที่ใช้เพื่อป้องกันการจัดทำดัชนีหรือการขูดที่ไม่พึงประสงค์ สิ่งนี้เกิดขึ้นเมื่อตัวรวบรวมข้อมูลเข้าถึงไซต์โดยไม่ระบุตัวเองอย่างถูกต้องหรือเมื่อหลีกเลี่ยงการตรวจจับอย่างแข็งขันโดยการบิดเบือนความจริงผ่านสตริงตัวแทนผู้ใช้ที่ทำให้เข้าใจผิดหรือมาจากโครงสร้างพื้นฐานที่ไม่เกี่ยวข้องกับเครือข่ายบอทที่รู้จักของ บริษัท จากข้อมูลของ CloudFlare นี่เป็นสิ่งที่น่าระทึกใจอย่างแม่นยำ

CloudFlare ตั้งข้อสังเกตว่า IPS ที่เกี่ยวข้องในกิจกรรมไม่ตรงกับข้อมูลการรวบรวมข้อมูลที่ประกาศของ Perplexity มันบอกว่าตัวรวบรวมข้อมูลสาธารณะของ Perplexity ที่ชื่อว่า PerplexityBot เคารพกฎการไม่เข้าร่วม อย่างไรก็ตามการรับส่งข้อมูลที่เป็นปัญหามาจากโครงสร้างพื้นฐานที่แตกต่างกันโดยสิ้นเชิงกับตัวแทนผู้ใช้ทั่วไปหรือตัวแทนที่ว่างเปล่าและยังคงร้องขอข้อมูลต่อไปแม้ว่าเว็บไซต์จะไม่อนุญาตให้มีการรวบรวมข้อมูลอย่างชัดเจน CloudFlare อ้างว่าเมื่อพวกเขาบล็อกบอทเหล่านี้การรับส่งข้อมูลจะเปลี่ยนไปใช้เครือข่ายอื่นเพื่อลองอีกครั้งชี้ไปที่การหลีกเลี่ยงโดยเจตนา

ความงุนงงตอบสนองต่อการเรียกร้องที่บอกว่าเข้าถึงหน้าเว็บสาธารณะเท่านั้นและแสดงถึงกิจกรรมการรวบรวมข้อมูลไปยังผู้ให้บริการบุคคลที่สาม บริษัท ไม่ได้ปฏิเสธการใช้ข้อมูลนั้นโดยตรงในผลิตภัณฑ์ อย่างไรก็ตาม CloudFlare แย้งว่าการตอบสนองนี้ก้าวเท้าหลีกเลี่ยงปัญหาหลัก: การรับส่งข้อมูลยังคงกดปุ่มเว็บไซต์โดยไม่ต้องทำตามข้อ จำกัด ที่โพสต์อย่างชัดเจนและมันถูกย้อนกลับไปสู่การดำเนินการแบ็กเอนด์ของ Perplexity

ดูเพิ่มเติม:Apple กล่าวหาว่า Corellium ขายซอฟต์แวร์ให้กับแฮ็กเกอร์ iPhone เช่น NSO และอื่น ๆ

ข้อกังวลที่กว้างขึ้นจาก CloudFlare คือ บริษัท AI บางแห่งกำลังเพิกเฉยต่อมาตรฐานเว็บมากขึ้นเรื่อย ๆ ในขณะที่การสร้างผลิตภัณฑ์เชิงพาณิชย์ด้านบนของเนื้อหาที่ถูกคัดลอก โพสต์เน้นว่าเว็บไซต์หลายล้านเว็บไซต์ที่ใช้บริการของ CloudFlare ได้ตั้งค่ากฎเพื่อบล็อกซอฟต์แวร์รวบรวมข้อมูลเฉพาะหรือบอทอัตโนมัติทั้งหมดและกฎเหล่านั้นจะต้องได้รับการเคารพจากใครก็ตามที่ทำหน้าที่โดยสุจริต Cloudflare ยังกล่าวอีกว่ากำลังทำงานเพื่อเสริมสร้างเครื่องมือลดบอทและเริ่มปิดกั้นเทคนิคการหลีกเลี่ยงดังกล่าวอย่างจริงจังมากขึ้น

ความตึงเครียดเกิดขึ้นท่ามกลางการตรวจสอบที่เพิ่มขึ้นเกี่ยวกับวิธีการที่ บริษัท AI ได้รับข้อมูลการฝึกอบรมของพวกเขา เมื่อการแข่งขันใน AI ทวีความรุนแรงมากขึ้น บริษัท จำนวนมากกำลังถูกจับได้ผลักดันขอบเขตของการรวบรวมข้อมูลจริยธรรม กรณีนี้ที่เกี่ยวข้องกับความงุนงงเพิ่มการอภิปรายที่กว้างขึ้นเกี่ยวกับความโปร่งใสการอนุญาตและวิธีการฝึกอบรม AI เครื่องมือ