MyDataProvider » المدونة » هل تجريف الويب غير قانوني؟

هل تجريف الويب غير قانوني؟

يشار إليه أيضًا باسم الزحف على الويب أو التجسس ، يشير تجريف الويب إلى العملية الآلية لجمع البيانات من مواقع الويب الخاصة بأفراد آخرين. هذه الممارسة هي بلا شك واحدة من أفضل الطرق لتعدين بيانات المنافسين. في حين يمكن الاتفاق على فعاليتها بالإجماع ، تأتي هذه الممارسة مع تحذير: فهي من بين أصعب الأدوات التي يمكن تحليلها من منظور قانوني. ولكن ، هل تجريف الويب غير قانوني؟

في الأساس ، يعمل تجريف الويب من خلال تصفح صفحات المواقع المستهدفة لاستخراج البيانات. تقوم محركات البحث مثل binge و Google أيضًا بعمل نفس الشيء أثناء فهرسة الصفحات. ومع ذلك ، فإن برنامج الكشط يأخذ درجة أعلى ويحول جميع البيانات المستخرجة إلى تنسيق يمكن نقله بسهولة إلى جدول بيانات أو قاعدة بيانات.

من الضروري الإشارة إلى أن مكشطة الويب ليست هي نفسها واجهة برمجة التطبيقات. يمكن للشركة في بعض الأحيان توفير واجهة برمجة تطبيقات لتسهيل تفاعل الأنظمة الأخرى مع البيانات. ومع ذلك ، فإن كمية وكمية البيانات المتاحة من خلال API أقل نسبيًا من البيانات المتوفرة من خلال تجريف الويب. علاوة على ذلك ، غالبًا ما توفر أدوات كشط الويب معلومات أكثر حداثة مقارنة بمعلومات API. هذا يجعل من السهل تخصيص المعلومات من وجهة نظر هيكلية.

يتمتع تجريف الويب بتطبيقات واسعة النطاق. على سبيل المثال ، قد يستخدمها الصحفي لمتابعة ورصد إحصائيات كرة القدم والحصول على قصة رياضية جديدة قد يعملون عليها. وبالمثل ، قد تتخلص شركة التجارة الإلكترونية من أشياء مثل عناوين المنتجات ، و SKU ، والأسعار من مواقع الويب المنافسة في محاولة لتحليلها بشكل أكبر.

على الرغم من كونه أداة قوية في ما يتعلق به ، إلا أن تجريف الويب يتصارع مع المسائل القانونية. نظرًا لأن العملية برمتها تتضمن تخصيص محتوى موجود مسبقًا من مواقع ويب مختلفة ، فهناك عدد لا يحصى من المشاكل ذات الطبيعة الأخلاقية والقانونية للأعمال التجارية التي تتطلع إلى استخدام التجريف لمصالحها الخاصة. حاليًا ، الآثار القانونية المترتبة على تجريف الويب في حالة تغير نوعًا ما. ومع ذلك ، فإنه لا يقدر بثمن الحصول على موطئ قدم في الجانب الأيمن من العملة ، من الناحية القانونية.

 ما هو تجريف الويب؟

للتأكد من أن ذلك كان على نفس الوتيرة ، دعونا نفهم ما هو تجريف الويب. إنه الإسقاط التلقائي لبيانات الويب واستخدام المعلومات التي تم جمعها لتنمية أعمالك. يتم تخزين قصاصات المعلومات في أي مكان - قاعدة بيانات أو ملفات

هل تجريف الويب غير قانوني؟

على مر السنين ، انخفضت سمعة تجريف الويب. فيما يلي أسباب ذلك.

  • يتم استخدام تجريف الويب من قبل الشركات لاكتساب ميزة تنافسية.
  • يتعارض تمامًا مع قوانين حقوق النشر وشروط الخدمة.
  • يعد تجريف الويب أمرًا مسيئًا بطبيعته ، بمعنى أن أدوات كشط الويب يمكنها إرسال طلبات عديدة في كثير من الأحيان أكثر من الأنشطة البشرية ، وبالتالي إنشاء عبء غير ضروري على موقع الويب. والأسوأ من ذلك ، يمكن لبرامج كاشط الويب اختيار العمل بشكل مجهول.

العديد من الأشخاص والشركات لديهم أدوات كشط الويب الخاصة بهم. تسبب وجود أطنان من برامج تجريف الويب في السوق في حدوث صداع لمواقع الويب التي يتم كشطها في معظم الأوقات مثل مواقع الشبكات الاجتماعية - (Facebook و Twitter و Instagram). والمتاجر عبر الإنترنت مثل Amazon أو eBay. هذا هو سبب إجبار Facebook على فصل شروط جمع البيانات.

على العكس من ذلك ، فقد استخدم تجريف الويب بواسطة محركات البحث مثل Google أو Yahoo لتنزيل فهرس الويب. ساعد نشاط تجريف الويب شركات محركات البحث على بناء سمعة طيبة بمرور الوقت نظرًا لأنها تحصل دائمًا على معلومات تضيف قيمة إلى موقعها على الويب.

كثرة القضايا القانونية في تجريف الويب

انتهاك حقوق الملكية

قد لا يتعلق مصطلح حقوق النشر بعملية تجريف الويب نفسها ، ولكنه يظهر عندما يتعلق الأمر بما تفعله بمحتويات العملية النهائية. إذا كانت البيانات من المواقع التي تقوم بكشطها محمية بموجب حقوق الطبع والنشر ، فلا توجد طريقة لاستخدام البيانات. على سبيل المثال ، لا يمكنك تحميله على موقعك أو استخدامه لأغراض تجارية. هذا يعني أنه قبل حذف موقع ويب ، من الحكمة معرفة ما إذا كان المحتوى محميًا بحقوق الطبع والنشر.

انتهاك قانون الاحتيال وإساءة استخدام الكمبيوتر

بينما يمكن تطبيق القانون في مثل هذه السيناريوهات ، فقد تم اختراعه لمنع تجريف الويب. إنه في الواقع ضد المتسللين. باختصار ، الأمر كله يتعلق بالوصول إلى محتوى موقع الويب دون الوصول المصرح به. بالنظر إلى أن تجريف الويب يتيح للشخص فقط الوصول إلى المعلومات العامة ، فقد يبدو أنه لا علاقة له بهذا القانون.

ومع ذلك ، قد يكون لدى بعض الكاشطات دوافع شريرة مثل استغلال الناس أو حتى السخرية منهم. هذا يجعل العملية انتهاكا للقانون. والمثال النموذجي هو عندما حصل موقع Jerk.com ، في عام 2009 ، على صور من Facebook قبل أن يطلب بعض المال لإزالتها. في هذه الحالة ، فهو ليس غير أخلاقي فحسب ، بل إنه غير قانوني أيضًا.

التعدي على الممتلكات

يتم انتهاك هذا القانون عندما يضر مكشطة الويب مباشرة بخادم الموقع بأي شكل من الأشكال. معظم برامج كاشط الويب مغرمة بإيذاء الخوادم أثناء أنشطتها. الخطأ الآخر الذي يمكن أن يفعله مبتدئ مكشطة الويب بسهولة هو تقديم الطلبات كثيرًا. في البداية ، لا يهم عدد طلبات HTTP التي يقوم بها الكاشطة. كل ما يهمهم هو الحصول على البيانات التي يحتاجونها في أسرع وقت ممكن.

إن الآثار المترتبة على تقديم العديد من الطلبات إلى الخادم تجعل موقع الويب يتأثر - ويقلل من أدائه. هذا ما يجعلها ممارسة سيئة. وبالتالي ، فإن انتهاك التعدي على الممتلكات يحدث عندما يجعل الكاشطة الخادم بطيئًا ويعيق أداء موقع الويب. في بعض الأحيان ، قد تقوم أداة الكشط بشيء يتعارض مع التشغيل الطبيعي للموقع.

والأسوأ من ذلك ، قد يعتقد مالك الموقع أنك تطلب معلومات عن قصد على صفحاته بوتيرة عالية. قد تلعب دور محاولة مهاجمة الموقع.

باختصار ، فإن الآثار القانونية المترتبة على تجريف الويب هي منطقة رمادية. ومع ذلك ، هناك بعض القوانين الحالية التي قد تشير إلى أن ممارسة تجريف الويب غير قانونية. ومع ذلك ، تشير بعض القوانين إلى أن العملية برمتها ليست غير قانونية عندما يكون نية كشط البيانات ضارة.