Khái niệm về Web Tracking ở thời điểm hiện tại không còn quá xa lạ với mọi người. Tuy nhiên để có cái nhìn sâu xa về nó thì không phải ai cũng có thể biết. Bài viết dưới đây sẽ giúp các bạn có thêm kiến thức về web tracking và một số kĩ thuật tracking ít người biết đến.
I. Web Tracking là gì?
Web Tracking được coi là một cách thức hay là một khả năng của trang web, mà ở đây sử dụng các công cụ phần mềm nhằm theo dõi lượng khách truy cập vào trang web. Một cách dễ hiểu hơn Web tracking là cách mà người làm quản trị web thu nhập và chia sẽ những thông tin về hoạt động cụ thể cùng mỗi cá nhân người dùng trên World Wide Web. Với việc phân tích những hoạt động và thói quen của người sử dụng web của mỗi cá nhân sẽ đem lại cho các bạn những nội dung có liên quan đến sở thích cũng như nhu cầu của họ.
Một Web Tracker có nhiệm vụ vô cùng đơn giản đó chính là lưu trữ những hoạt động của bạn khi lên web. Chúng có thể lưu lại tên của bạn (nếu bạn có đăng kí account bất kỳ nào đó), hơn nữa chúng có thể biết được bạn thích gì, bạn đang xem theo dõi trang web nào nhiều trong thời gian gần đây. Có một vài web tracking không sử dụng hết nguồn tài nguyên thu thập. Do đó chúng thường chia sẻ những tài liệu đó với những trang web khác nhằm buil lên một profile toàn diện hơn về bạn. Qua đó các bạn sẽ có được những gợi ý để quảng cáo đến người có nhu cầu.
Có nhiều bạn thắc mắc khi sử dụng facebook “tại sao lại thấy những mẩu quảng cáo về những món mình thích trên newfeed?” Để giải trả lời được câu hỏi này các bạn hãy cùng theo dõi tiếp bài đọc sau:
Bạn bị theo dõi bởi web tracking như thế nào?
Với những đoạn code hay những đoạn mà các bạn vẫn thường gọi là bugs thực tế không phải là lỗi đâu nha. Bởi lẽ chúng được nhúng trên web và thông báo tới các nhà Quản trị trang web mỗi khi mà bạn vào thăm một trang page bất kỳ. Ngày nay có nhiều Web họ sử dụng cookies để thu thập những thông tin trong quá khứ sử dụng web của bạn. Đặc biệt là những trang web xã hội họ luôn thu thập thông tin của bạn để quảng cáo của họ trở nên hiệu quả hơn.
Tất cả các hoạt động của bạn đều được theo dõi mà bạn không hề hay biết thậm chí là không có sự đồng ý của bạn. Gần như tất cả các web mà bạn thích, họ đều theo dõi phiên làm việc của bạn. Bởi lẽ họ cần những thông tin trong quá khứ của bạn để định hướng quảng cáo trong tương lai trở nên chính xác hơn.
Hiện tại Browser Firefox đã đưa ra một Add-on mới có tên là Lightbeam để bạn tiện hơn trong quá trình theo dõi người đã từng truy cập web cũng như đã yêu thích web của bạn mỗi khi bạn Online. Chính tính năng này sẽ giúp bạn xem được những Web Tracker đã track được gì từ bạn. Đồng thời giúp bạn hiểu rõ hơn về những thông tin và những hoạt động cá nhân của bạn trên Web sẽ về đâu.
Dưới đây là một số kĩ thuật Tracking mà các Web Tracker đang sử dụng mà không mấy người dùng có thể biết.
II. Web Bug/Beacon
Web Beacon là gì?
Web Beacon thường không hiển thị và là một object ảnh có thể luồn lách được vào máy của bạn. Đây là những object nhỏ và được nhúng trực tiếp vào những trang web, đồng thời vào email và được kích hoạt bất kỳ khi nào bạn kích hoạt trang web hoặc email có chứa chúng.
Web Beacon được đặt ngay vào web hoặc trong email sau đó chúng thực hiện theo dõi phần nào đó các công việc mà bạn làm trên Internet hoặc khi bạn tiến hành gửi email.
Web Beacon còn được gọi với những cái tên như là “tags”, “pixel trackers”, “tracking bugs”,… Dường như với những ai không chuyên thì đều khó có thể nhìn ra bởi chúng quá nhỏ, nhỏ hơn 1px x 1px. Chúng xuất hiện dưới dạng format GIF (Graphic Interchange Format)-đây là một định dạng được các web sử dụng phổ biến. Vì vậy đối với những browser chúng chỉ đóng vai trò như một bức hình bình thường mà khiến cho bạn và cả trình duyệt khó nhận ra đây là Web Beacon.
Tạo ra một Web Beacon cơ bản
Cách để tạo ra Web Beacon bằng ngôn ngữ lập trình PHP các bạn cần thực hiện kích hoạt tính năng URL rewriting module (mod_rewrite) của Apache. Tiếp đó bạn tạo một file .htaccess sau đó viết đoạn code sau vào file.
Tiếp đó là tạo file script.php
Để quan sát bạn chỉ cần click vào GIF để mở hoặc quan sát ở tab mới. Dưới đây là một ví dụ GIF mèo:
Thay vì được điều hướng tới link mong muốn thì bạn sẽ lại nhận được đoạn text:
URL tuy được trỏ đến file đích cat.gif nhưng trên quy trình thực tế thì file script.php đã được kích hoạt thực thi
Web Beacon xâm nhập như nào vào máy của bạn
Thông thường một Web Beacon sẽ truy cập vào máy tính của bạn qua Email hoặc có thể trên một trang web mà trước đây bạn truy cập. Có nhiều gọi nó với cái tên là “spyware” bởi nó lưu lại những hoạt động online của bạn trong tất cả mọi trường hợp, tuy nhiên với những web thì chúng thường không có tác dụng.
Web Beacon được dùng để làm gì?
Web Beacon dùng để track phần nào đó những hoạt động Online của bạn mỗi khi bạn có email hoặc truy cập vào trang web nào đó thường xuyên. Chúng ra đời với mục đích theo dõi một phần những hoạt động của bạn nhằm cung cấp những thông tin cho một số đơn vị cần nguồn tin đó. Những trang web dùng Web Beacon để biết được ai đã truy cập vào trang web của họ. Sau đó những mạng lưới quảng cáo, truyền thông sẽ sử dụng chúng để thu thập những thông tin về thói quen, hành vi của người dùng. Họ sử dụng Web Beacon để xem các chiến dịch quảng cáo của họ hiển thị như thế nào đến người dùng. Đồng thời xem quảng cáo này đã được xem bởi ai hoặc một cá nhân nào đã click vào quảng cáo đó như thế nào.
Tuy nhiên trong nhiều trường hợp xấu những Web Beacon được các Spammer dùng chúng với mục đích xác nhận rằng email đó có được active hay không. Chỉ cần các bạn click vào email, Web Beacon sẽ hoạt động và thực hiện gửi tin về cho người gửi (Spammer). Điều này tương ứng với việc bạn đã mở email, và email của bạn là một email thật. Chỉ trong tích tắc hòm thư của bạn trở nên hỗn độn bởi nhiều thư spam đến. Chính vì thế đừng tiếc vài giây để các thực email đó có đáng tin hay không trước khi xem sâu vào trong nó.
Disable Cookies sẽ hoạt động loại bỏ những vấn đề của Web Beacon.
Hoạt động của công cụ Disable Cookies sẽ giúp bạn debug, loại bỏ những vấn đề của Web Beacon
Flash Cookies
Flash Cookie hay còn có tên khác là Local Shared Object. Nó tồn tại dưới dạng một file text được gửi từ web server tới người dùng khi browser request tới những nội dung cần đến Adobe Flash, một plug-in không còn mới lạ.
Một Flash Cookie thường được dùng trong những tin quảng cáo trên Web và các video. Tương tự như PHP Cookie, Flash Cookie lưu những thông tin ở máy của người dùng. Chính những thông tin này sẽ giúp web nhận ra bạn mỗi khi bạn trở lại web. Trong nhiều trường hợp Flash cookie cũng lưu lại những thông tin mà PHP cookie lưu. Tuy nhiên chúng có thể lưu được nhiều thông tin hơn nữa. Ví dụ như người dùng đã Pause/Stop video ở vị trí nào, họ đã xem các banner quản cáo dưới dạng Flash chưa…
Flash Cookie khác với HTTP Cookie, những thông tin được lưu bởi Flash Cookie sẽ nằm ở một file Adobe và được quản lý bởi Adobe Flash Player. Những file Flash cookie thường có đuôi là .sol. Tuy nhiên có nhiều người không chuyên họ sẽ không biết đến sự tồn tại của Flash Cookie, đồng thời họ cũng không rõ xóa nó có ảnh hưởng đến máy hay không. Một điều nữa mà không nhiều người biết đó chính là Flash cookie có thể khôi phục được các HTTP Cookie đã bị xóa bỏ. Quá trình này có tên là respawing, việc làm này gây ra nhiều tranh cãi. Bởi lẽ chúng track người dùng trên Browser và chúng vi phạm đến những vấn đề về bảo mật vì việc các bạn sử dụng Flash cookie không nằm trong chính sách bảo mật của đa số trang web.
Để giảm thiếu cũng như ngừng việc respawing của một vài người. Adobe đã liên kết với rất nhiều trình duyệt thông dụng nhằm cung cấp cho người dùng quyền quản lý Local Shared Object ngay tại trình duyệt bằng API.
Canvas fingerprinting
Thẻ <canvas> chính là API của ngôn ngữ lập trình HTML5 dùng để vẽ đồ họa cũng như hoạt ảnh trên web thông qua việc sử dụng các script của JavaScript. Ngoài ra <canvas> còn được dùng với mục đích lấy Browser Fingerprinting để làm tracking online.
Đây là cách làm dựa trên việc một bản vẽ <canvas> có thể được reder khác nhau cho mỗi máy tính. Việc này xảy ra bởi những lý do sau.
- Ở tầng format hình ảnh – các trình dùng các engine xử lý những hình ảnh khác nhau, những options xuất hình, độ nén ảnh,… vì thế hình ảnh sẽ trở nên giống nhau, nhưng có checksum khác nhau.
- Đối với tầng hệ thống, hệ điều hành cho ra các front chữ khác nhau, đồng thời sử dụng những thuật toán và cài đặt riêng cho việc khử răng cưa cũng như sub-pixel rendering.
Với những thông tin quảng cáo lớn họ thường theo dõi người dùng với mục đích xây dựng hồ sơ về thói quen, sở thích của người dùng. Qua đó cung cấp những mẩu quảng cáo hiệu quả đến người dùng. Các bạn hoàn toàn có thể đảm bảo an toàn cho những thông tin thu thập được bằng các xóa đi các tập cookie trên máy hoặc ẩn. Việc làm này sẽ khiến các nhà quảng cáo hoạt động trở nên kém hiệu quả và thu về lợi nhuận thấp hơn. Do đó các công ty luôn có bước thử nghiệm để tìm ra những thông tin tốt nhất về người dùng.
HTML5 Canvas không chỉ dùng để xử lý hình ảnh mà các bạn có thể sử dụng để phát hiện nhiều hành động của con người thông qua việc theo dõi bàn phím, hay có thể là các thao tác cảm ứng trên màn hình di dộng.
Ngày nay HTML5 Canvas còn được hỗ trợ bởi rất nhiều trình duyệt thông dụng. Hơn nữa nó còn phục vụ hầu hết các thiết bị điển hình là PC, laptop và cả smart phone.
Kết luận
Bài viết trên đây đã giúp các bạn có thêm tài liệu về Web tracking cũng như một số kĩ thuật về web tracking. Hy vọng với bài viết các bạn sẽ có thêm kiến thức để thực hàng web tracking trở nên tốt hơn.