Làm thế nào một máy tính biết nơi bạn đang tìm kiếm?

Hãy tưởng tượng lái xe ô tô, sử dụng màn hình hiển thị hướng lên trên kính chắn gió để điều hướng qua một thành phố xa lạ. Đây là thực tế tăng cường (AR); thông tin được sử dụng để không chỉ hướng dẫn bạn dọc theo tuyến đường mà còn cảnh báo bạn về thông tin nổi bật trong môi trường xung quanh, chẳng hạn như người đi xe đạp hoặc người đi bộ. Vị trí chính xác của nội dung ảo không chỉ quan trọng, mà có lẽ là vấn đề sống chết.

Thông tin không thể che khuất tài liệu khác và phải được hiển thị đủ lâu để bạn hiểu nó, nhưng không quá lâu hơn thế. Các hệ thống máy tính phải thực hiện các quyết định này trong thời gian thực, mà không làm cho bất kỳ thông tin nào bị phân tâm hoặc gây khó chịu. Chúng tôi chắc chắn không muốn cảnh báo về một người đi xe đạp sắp băng qua phía trước xe để che khuất chính người đi xe đạp!

Là một nhà nghiên cứu về AR, tôi dành nhiều thời gian để cố gắng tìm ra cách đưa thông tin đúng vào màn hình của người dùng, ở đúng nơi, đúng thời điểm. Tôi đã học được rằng hiển thị quá nhiều thông tin có thể gây nhầm lẫn cho người dùng, nhưng không hiển thị đủ có thể khiến ứng dụng trở nên vô dụng. Chúng ta phải tìm ra điểm ngọt ngào ở giữa.

Một yếu tố quan trọng của điều này, hóa ra, là biết người dùng đang tìm kiếm ở đâu. Chỉ sau đó chúng tôi mới có thể cung cấp thông tin họ muốn ở một vị trí nơi họ có thể xử lý thông tin đó. Nghiên cứu của chúng tôi liên quan đến việc đo lường nơi người dùng đang nhìn vào cảnh thật, như một cách để giúp quyết định nơi đặt nội dung ảo. Với AR đã sẵn sàng xâm nhập vào nhiều lĩnh vực trong cuộc sống của chúng ta - từ lái xe đến công việc đến vui chơi giải trí - chúng tôi sẽ cần giải quyết vấn đề này trước khi chúng tôi có thể dựa vào AR để cung cấp hỗ trợ cho các hành động nghiêm trọng hoặc quan trọng.

Xác định nơi để đặt thông tin

Nó có ý nghĩa để có thông tin xuất hiện nơi người dùng đang tìm kiếm. Khi điều hướng, người dùng có thể nhìn vào một tòa nhà, đường phố hoặc vật thể thực khác để tiết lộ thông tin ảo liên quan; hệ thống sẽ biết cách ẩn tất cả các màn hình khác để tránh làm lộn xộn cảnh có thể nhìn thấy.


đồ họa đăng ký nội tâm


Nhưng làm thế nào để chúng ta biết những gì ai đó đang nhìn? Nó chỉ ra rằng các sắc thái của tầm nhìn của con người cho phép chúng ta kiểm tra bằng mắt của một người và tính toán nơi họ đang tìm kiếm. Bằng cách ghép các dữ liệu đó với các camera hiển thị trường nhìn của một người, chúng ta có thể xác định được người đó đang nhìn gì và người đó đang nhìn gì.

Các hệ thống theo dõi mắt lần đầu tiên xuất hiện trong 1900s. Ban đầu chúng chủ yếu được sử dụng để nghiên cứu các mẫu đọc; một số có thể rất khó chịu cho người đọc. Gần đây, theo dõi bằng mắt thời gian thực đã xuất hiện và trở nên hợp lý hơn, dễ vận hành hơn và nhỏ hơn.

Theo dõi mắt có thể được gắn vào màn hình hoặc tích hợp vào kính đeo hoặc màn hình gắn trên đầu. Mắt được theo dõi bằng cách sử dụng kết hợp máy ảnh, máy chiếu và thuật toán thị giác máy tính để tính toán vị trí của mắt và điểm nhìn trên màn hình.

Chúng tôi thường xem xét hai biện pháp khi kiểm tra dữ liệu theo dõi mắt. Đầu tiên được gọi là một cố địnhvà được sử dụng để mô tả khi chúng ta tạm dừng cái nhìn của mình, thường ở một vị trí thú vị trong một cảnh bởi vì nó đã thu hút sự chú ý của chúng ta. Thứ hai là một saccade, một trong những chuyển động mắt nhanh được sử dụng để định vị ánh mắt. Thời gian cố định ngắn được theo sau bởi các chuyển động nhanh, được gọi là saccade. Về cơ bản, đôi mắt của chúng ta nhanh chóng phóng từ nơi này sang nơi khác lấy những mẩu thông tin về các phần của một cảnh. Bộ não của chúng ta sau đó đưa thông tin từ các bản sửa lỗi này lại với nhau để tạo thành một hình ảnh trực quan trong tâm trí của chúng ta.

{youtube}tdFIvRMvFQI{/youtube}

Kết hợp theo dõi mắt với AR

Thông thường nội dung AR được neo vào một đối tượng hoặc vị trí trong thế giới thực. Ví dụ: nhãn ảo chứa tên đường phố sẽ được hiển thị trên đường đó. Lý tưởng nhất, chúng tôi muốn các nhãn AR xuất hiện gần với đối tượng thực mà nó được liên kết. Nhưng chúng ta cũng cần cẩn thận không để nhiều nhãn AR trùng nhau và không thể đọc được. Có nhiều cách tiếp cận để quản lý vị trí nhãn. Chúng tôi đang khám phá một lựa chọn: tính toán nơi người đó đang nhìn trong cảnh thực và chỉ hiển thị nhãn AR ở vị trí đó.

Ví dụ, một người dùng đang tương tác với một ứng dụng di động giúp anh ta mua ngũ cốc có hàm lượng calo thấp trong cửa hàng tạp hóa. Trong ứng dụng AR, mỗi loại ngũ cốc có thông tin calo liên quan đến nó. Thay vì chọn vật lý từng hộp ngũ cốc và đọc nội dung dinh dưỡng, người dùng có thể cầm thiết bị di động của mình và chỉ vào hộp ngũ cốc cụ thể để tiết lộ thông tin liên quan.

Nhưng hãy nghĩ về mức độ đông đúc của lối đi ngũ cốc với các gói khác nhau. Nếu không có cách nào đó để quản lý việc hiển thị nhãn AR, nhãn thông tin calo cho tất cả các hộp ngũ cốc sẽ được hiển thị. Sẽ không thể xác định được hàm lượng calo trong ngũ cốc mà anh ta quan tâm.

Bằng cách theo dõi đôi mắt của anh ấy, chúng tôi có thể xác định hộp ngũ cốc cá nhân mà người dùng đang nhìn vào. Sau đó, chúng tôi hiển thị thông tin calo cho ngũ cốc cụ thể. Khi anh ta chuyển ánh mắt sang một hộp khác, chúng tôi sẽ hiển thị các số liệu cho người tiếp theo anh ta xem xét. Màn hình của anh ấy không bị lộn xộn, thông tin anh ấy muốn có sẵn và khi anh ấy cần thêm thông tin, chúng tôi có thể hiển thị điều đó.

Kiểu phát triển này làm cho nó trở thành một thời gian thú vị cho nghiên cứu AR. Khả năng của chúng tôi để tích hợp các cảnh trong thế giới thực với đồ họa máy tính trên màn hình di động đang được cải thiện. Điều này thúc đẩy triển vọng tạo ra các ứng dụng mới tuyệt đẹp giúp mở rộng khả năng tương tác, học hỏi và giải trí của thế giới xung quanh chúng ta.

Giới thiệu về Tác giả

Ann McNamara, Phó Giáo sư Trực quan hóa, Đại học Texas A & M

Bài viết này ban đầu được xuất bản vào Conversation. Đọc ban đầu bài viết.

Sách liên quan

at

phá vỡ

Cảm ơn đã ghé thăm Nội địa.com, ở đâu có 20,000 + những bài báo thay đổi cuộc sống quảng bá "Thái độ mới và những khả năng mới". Tất cả các bài viết được dịch sang Hơn 30 ngôn ngữ. Theo dõi đến Tạp chí Nội tâm, xuất bản hàng tuần và Cảm hứng hàng ngày của Marie T Russell. Tạp chí InsideSelf đã được xuất bản từ năm 1985.