09/05/2018, 20:43
Captcha là gì?
là chữ viết tắt của "", có nghĩa là Phép thử Turing công cộng hoàn toàn tự động để phân biệt máy tính với người, hoặc có thể hiểu đơn giản là đoạn mã để xác nhận người dùng có phải là người dùng thực hay không, chứ không phải máy tính hoặc robot đang thực hiện hành động nào đó. được trường Đại học ...
là chữ viết tắt của "", có nghĩa là Phép thử Turing công cộng hoàn toàn tự động để phân biệt máy tính với người, hoặc có thể hiểu đơn giản là đoạn mã để xác nhận người dùng có phải là người dùng thực hay không, chứ không phải máy tính hoặc robot đang thực hiện hành động nào đó. được trường Đại học Carnegie Mellon cố gắng đăng ký thương hiệu nhưng đã bị bác bỏ. Đây là một quá trình một máy tính (máy chủ) yêu cầu một người dùng hoàn tất một kiểm tra đơn giản mà máy tính có thể dễ dàng tạo ra và đánh giá, nhưng không thể tự giải nó được. Vì máy tính không thể giải quyết CAPTCHA, bất kỳ người dùng nào nhập vào lời giải đúng sẽ được xem là con người.
Hình ảnh minh họa của một CAPTCHA
Một (ˈkæptʃə, đọc giống như "capture") là một loại kiểm thử dạng hỏi đáp được dùng trong máy tính để xác định xem người dùng có phải là con người hay không.
được Luis von Ahn, Manuel Blum, Nicholas J. Hopper (tất cả đều thuộc Đại học Carnegie Mellon), và John Langford (khi đó thuộc IBM) đặt ra vào năm 2000. Một loại CAPTCHA phổ biến yêu cầu người dùng phải nhập các chữ cái trong một tấm hình méo mó, đôi khi cùng với một dãy số hoặc chữ lờ mờ xuất hiện trên màn hình.
Một CAPTCHA đôi khi được mô tả như một phép thử Turing ngược, vì nó được một máy tạo ra và nhắm vào con người, ngược lại với phép thử Turing chuẩn do con người tạo ra và nhắm vào máy.
Đặc điểm
Một hệ thống là một dạng thử thách mới được tạo ra tự động trong đó:
Các máy tính hiện nay không thể giải được một cách chính xác.
Đa số con người có thể giải được.
Không phụ thuộc vào loại CAPTCHA đó có mới lạ đối với kẻ tấn công hay không. Mặc dù một hộp kiểm "nhấn vào đây nếu bạn không phải là máy" có thể được dùng để phân biệt giữa người với máy tính, nhưng nó không phải CAPTCHA vì nó phụ thuộc vào sự thật là kẻ tấn công không phải mất quá nhiều công sức để phá biểu mẫu kiểu đó.
Nguồn gốc
Sự khó khăn tiềm tàng trong việc phân biệt giữa người và máy tính mạo danh con người đã được đề ra từ những năm 1950, khi Alan Turing mô tả phép thử Turing mà ngày nay đã trở nên rất nổi tiếng của ông. Cuộc bàn luận đầu tiên về các thử nghiệm tự động để phân biệt con người với máy tính với mục đích kiểm soát sự truy cập các dịch vụ web xuất hiện trong bản thảo năm 1996 của Moni Naor từ Viện Khoa học Weizmann, có tên "Lĩnh vực xác minh con người, hay Sự định danh thông qua Phép thử Turing" Naor, Moni (1996). "Verification of a human in the loop or Identification via the Turing Test".
Những nguyên thủy có lẽ được phát triển vào năm 1997 tại AltaVista, do Andrei Broder và đồng nghiệp của ông sáng tạo để ngăn ngừa bot thêm URL vào bộ máy tìm kiếm của họ. Để khiến cho hình ảnh chống lại được OCR (Nhận dạng ký tự quang học), nhóm đã mô phỏng những tình huống mà những cuốn hướng dẫn bộ quét cho rằng sẽ dẫn đến kết OCR sai. Vào năm 2000, von Ahn và Blum đã phát triển và công khai khái niệm CAPTCHA, bao gồm bất kỳ chương trình nào có thể phân biệt con người với máy tính. Họ đã sáng chế ra nhiều mẫu CAPTCHA, gồm có những CAPTCHA đầu tiên được sử dụng rộng rãi, và cũng chính là những loại được Yahoo! sử dụng.
Ứng dụng
được dùng để ngăn chặn phần mềm tự động thực hiện những tác vụ có thể làm giảm đi chất lượng dịch vụ của một hệ thống có sẵn, có thể bằng cách lạm dụng hoặc làm hao tổn tài nguyên. CAPTCHA có thể được dùng để bảo vệ hệ thống chống lại spam e-mail, như các dịch vụ webmail của Gmail, Hotmail, và Yahoo!. CAPTCHA cũng được dùng nhiều trong việc ngăn chặn đăng bài tự động trong blog hoặc diễn đàn, có thể với mục đích quảng cáo thương mại, hoặc quấy rối và phá hoại. CAPTCHA cũng có chức năng quan trọng trong hạn chế quá tải, vì việc sử dụng tự động một dịch vụ là điều mong muốn cho đến khi cách dùng đó bắt đầu vượt quá giới hạn, và làm tổn hại đến những người dùng là con người. Trong trường hợp đó, một CAPTCHA có thể thực thi quy định sử dụng tự động do người quản trị đặt ra khi giá trị đo lường mức sử dụng vượt quá một ngưỡng cho trước. Hệ thống xếp hạng bài viết được nhiều trang web tin tức sử dụng cũng là một ví dụ về cơ chế trực tuyến chống lại sự tính toán của phần mềm tự động.
Ngoài thuật ngữ thì còn có
Hiện nay, được những người đã chế tạo ra CAPTCHA ban đầu khuyên dùng như cách hiện thực CAPTCHA chính thức.
reCAPTCHA được phát triển và cung cấp bởi trường đại học Carnegie Mellon. reCAPTCHA là sự kết hợp sáng tạo giữa CAPTCHA với việc số hóa các bản scan sách. Cụ thể, một mặt nó cung cấp dịch vụ CAPTCHA miễn phí cho người sử dụng thông qua website recaptcha.net để đưa vào các website khác, mặt khác, nó sử dụng chính dữ liệu mà người dùng đã xác thực để số hóa các cuốn sách mà bản thân các phần mềm số hóa không thể đọc được.
Mailhide
cũng mới tạo dự án Mailhidanscos nhiệm vụ bảo vệ các địa chỉ email trên các trang web khỏi bị spam. Mặc định, địa chỉ email sẽ được chuyển sang dạng mà các bộ máy tìm kiếm và các phần mềm bóc dữ liệu web (crawler) không thể lấy được địa chỉ đầy đủ. Ví dụ, "mailme@example.com" sẽ bị chuyển thành "mai...@example.com". Người duyệt web có thể kích chuột vào dấu "..." và điền vào một mã ReCAPTCHA được yêu cầu để có thể thấy địa chỉ email đầy đủ.
Hình ảnh minh họa của một CAPTCHA
Một (ˈkæptʃə, đọc giống như "capture") là một loại kiểm thử dạng hỏi đáp được dùng trong máy tính để xác định xem người dùng có phải là con người hay không.
được Luis von Ahn, Manuel Blum, Nicholas J. Hopper (tất cả đều thuộc Đại học Carnegie Mellon), và John Langford (khi đó thuộc IBM) đặt ra vào năm 2000. Một loại CAPTCHA phổ biến yêu cầu người dùng phải nhập các chữ cái trong một tấm hình méo mó, đôi khi cùng với một dãy số hoặc chữ lờ mờ xuất hiện trên màn hình.
Một CAPTCHA đôi khi được mô tả như một phép thử Turing ngược, vì nó được một máy tạo ra và nhắm vào con người, ngược lại với phép thử Turing chuẩn do con người tạo ra và nhắm vào máy.
Đặc điểm
Một hệ thống là một dạng thử thách mới được tạo ra tự động trong đó:
Các máy tính hiện nay không thể giải được một cách chính xác.
Đa số con người có thể giải được.
Không phụ thuộc vào loại CAPTCHA đó có mới lạ đối với kẻ tấn công hay không. Mặc dù một hộp kiểm "nhấn vào đây nếu bạn không phải là máy" có thể được dùng để phân biệt giữa người với máy tính, nhưng nó không phải CAPTCHA vì nó phụ thuộc vào sự thật là kẻ tấn công không phải mất quá nhiều công sức để phá biểu mẫu kiểu đó.
Nguồn gốc
Sự khó khăn tiềm tàng trong việc phân biệt giữa người và máy tính mạo danh con người đã được đề ra từ những năm 1950, khi Alan Turing mô tả phép thử Turing mà ngày nay đã trở nên rất nổi tiếng của ông. Cuộc bàn luận đầu tiên về các thử nghiệm tự động để phân biệt con người với máy tính với mục đích kiểm soát sự truy cập các dịch vụ web xuất hiện trong bản thảo năm 1996 của Moni Naor từ Viện Khoa học Weizmann, có tên "Lĩnh vực xác minh con người, hay Sự định danh thông qua Phép thử Turing" Naor, Moni (1996). "Verification of a human in the loop or Identification via the Turing Test".
Những nguyên thủy có lẽ được phát triển vào năm 1997 tại AltaVista, do Andrei Broder và đồng nghiệp của ông sáng tạo để ngăn ngừa bot thêm URL vào bộ máy tìm kiếm của họ. Để khiến cho hình ảnh chống lại được OCR (Nhận dạng ký tự quang học), nhóm đã mô phỏng những tình huống mà những cuốn hướng dẫn bộ quét cho rằng sẽ dẫn đến kết OCR sai. Vào năm 2000, von Ahn và Blum đã phát triển và công khai khái niệm CAPTCHA, bao gồm bất kỳ chương trình nào có thể phân biệt con người với máy tính. Họ đã sáng chế ra nhiều mẫu CAPTCHA, gồm có những CAPTCHA đầu tiên được sử dụng rộng rãi, và cũng chính là những loại được Yahoo! sử dụng.
Ứng dụng
được dùng để ngăn chặn phần mềm tự động thực hiện những tác vụ có thể làm giảm đi chất lượng dịch vụ của một hệ thống có sẵn, có thể bằng cách lạm dụng hoặc làm hao tổn tài nguyên. CAPTCHA có thể được dùng để bảo vệ hệ thống chống lại spam e-mail, như các dịch vụ webmail của Gmail, Hotmail, và Yahoo!. CAPTCHA cũng được dùng nhiều trong việc ngăn chặn đăng bài tự động trong blog hoặc diễn đàn, có thể với mục đích quảng cáo thương mại, hoặc quấy rối và phá hoại. CAPTCHA cũng có chức năng quan trọng trong hạn chế quá tải, vì việc sử dụng tự động một dịch vụ là điều mong muốn cho đến khi cách dùng đó bắt đầu vượt quá giới hạn, và làm tổn hại đến những người dùng là con người. Trong trường hợp đó, một CAPTCHA có thể thực thi quy định sử dụng tự động do người quản trị đặt ra khi giá trị đo lường mức sử dụng vượt quá một ngưỡng cho trước. Hệ thống xếp hạng bài viết được nhiều trang web tin tức sử dụng cũng là một ví dụ về cơ chế trực tuyến chống lại sự tính toán của phần mềm tự động.
Ngoài thuật ngữ thì còn có
Hiện nay, được những người đã chế tạo ra CAPTCHA ban đầu khuyên dùng như cách hiện thực CAPTCHA chính thức.
reCAPTCHA được phát triển và cung cấp bởi trường đại học Carnegie Mellon. reCAPTCHA là sự kết hợp sáng tạo giữa CAPTCHA với việc số hóa các bản scan sách. Cụ thể, một mặt nó cung cấp dịch vụ CAPTCHA miễn phí cho người sử dụng thông qua website recaptcha.net để đưa vào các website khác, mặt khác, nó sử dụng chính dữ liệu mà người dùng đã xác thực để số hóa các cuốn sách mà bản thân các phần mềm số hóa không thể đọc được.
Mailhide
cũng mới tạo dự án Mailhidanscos nhiệm vụ bảo vệ các địa chỉ email trên các trang web khỏi bị spam. Mặc định, địa chỉ email sẽ được chuyển sang dạng mà các bộ máy tìm kiếm và các phần mềm bóc dữ liệu web (crawler) không thể lấy được địa chỉ đầy đủ. Ví dụ, "mailme@example.com" sẽ bị chuyển thành "mai...@example.com". Người duyệt web có thể kích chuột vào dấu "..." và điền vào một mã ReCAPTCHA được yêu cầu để có thể thấy địa chỉ email đầy đủ.