Sử dụng các filter để thêm vui vẻ với hình ảnh selfie trên các mạng xã hội cũng như là nhận diện khuôn mặt để mở khoá điện thoại, xếp chung đều là những công nghệ mới, nhưng nói đơn giản hơn thì gương mặt cũng như một dấu vân tay và để nhận diện được thì đòi hỏi mức độ cao hơn và phức tạp hơn.

Bất kì công nghệ mới nào cũng cần có nền tảng để bắt đầu những thứ phức tạp hơn, và với những thứ phức tạp trên thì sẽ được ứng dụng nhiều hơn trong nhiều lĩnh vực như là quận đội, cảnh sát, quảng cáo và … deepfake, hầu hết gọi là ứng dụng nhưng với deepfake thì sẽ gọi là tận dụng thì đúng hơn với việc nhận dạng được khuôn mặt.

Nhận dạng khuôn mặt, hiểu theo cách đơn giản

Nhận dạng khuôn mặt với bao gồm 3 ứng dụng chính:

Nhận dạng đơn giản: Hầu hết là để ‘vui vẻ’ nên nó thường sẽ là Animoji hay các bộ filter của Instagram hay Snapchat và vô số kể các ứng dụng tương tự. Ở đây camera của điện thoại sẽ ‘nhìn’ để nhận diện ra khuôn mặt, đặc điểm của mắt, mũi và miệng sau đó sử dụng các thuật toán để khoá các hiệu ứng và định hướng chúng, nếu như mở miệng sẽ tạo ra thêm các hiệu ứng khác. Và điều đáng nói ở đây đó là nó chỉ đang cố nhận dạng khuôn mặt, và ở mức độ này là ‘tìm kiếm’ khuôn mặt.

Cho nhu cầu bảo mật (Face ID và những phần mềm tương tự): Trong quá trình thiết lập Face ID (hoặc phần mềm giống Face ID) thì thường sẽ yêu cầu bạn đưa điện thoại lên phía trước màn hình ở một khoảng cách nhất định để nhận diện được các đặc điểm. Và sau đó mỗi lần mở sáng màn hình Face ID sẽ lập tức dò tìm các đặc điểm của bạn để nhận diện người đang dùng có phải là bạn – chủ điện thoại hay không mà mở khoá thiết bị.

Nhận dạng một người nào đó: Nhận diện khuôn mặt ở ‘cấp độ cuối’ chính là điểm đến dành cho một tổ chức nào đó muốn nhận diện khuôn mặt dành cho bảo mật, quảng cáo hoặc mục đích liên quan kiểm soát con người. Ở mức độ này có phần giống với Face ID của Apple nhưng ở quy mô lớn hơn. Theo đó nó cần nhiều thông tin hơn nên mọi cơ sở dữ liệu nào ‘miễn phí’ đều có thể sử dụng như là chứng minh nhân dân – ID Card, hoặc Facebook với đầy hình ảnh riêng tư cùng nhiều góc độ là một nguồn dữ liệu lí tưởng.

Ở mức độ cơ bản thì chẳng có hại gì cả, nhưng khi ở cấp độ cao hơn, kẻ xấu muốn tận dụng chúng thì lại là chuyện khác, và đó mới chính là môi nguy hại mà bạn hay tất cả mọi người cần đề phòng.

Hầu hết việc nhận dạng khuôn mặt đều là từ hình ảnh 2D

Hầu hết các phần mềm nhận dạng khuôn mặt đều hoàn toàn dựa trên hình ảnh 2D. Nhưng vì hình ảnh 2D lại là một hình ảnh mang đến độ chính xác ‘ở mức máy móc’, máy dễ dàng nhận diện được khi sử dụng hình ảnh 2D nên vẫn được ưa chuộng.

Vì sao ảnh 2D có độ chính xác? Đó là vì nó không có chiều sâu, và vì điều này khiến cho khuôn mặt ‘được’ nhận diện thiếu đi các đặc điểm nhận dạng riêng biệt hay ít biến số hơn nên dễ nhận diện hơn. Với một hình ảnh 2D hay hình ảnh phẳng hoàn toàn, máy tính có thể do khoảng cách độ rộng của miệng, khoảng cách mắt, độ rộng đồng tử và nhiều những biến số khác nhưng nó lại không thể đo được chiều dài/cao/cong mũi, đặc điểm trán bạn chẳng hạn, nó trở nên bất khả thi với hình ảnh 2D.

Cùng đó hình ảnh 2D phụ thuộc vào ánh sáng khá nhiều, vậy nên khi liên quan đến hình ảnh 2D thì không thể hoạt động trong môi trường thiếu sáng tốt và mất đi độ tin cậy. Từ đây nhận dạng 3D được ra đời để cải thiện được các vấn đề ánh sáng của hình ảnh 2D cũng như là tính bảo mật, vì ảnh 2D nếu trong bảo mật lại dễ bị làm giả hơn rất nhiều so với 3D.

IR Camera: Camera hồng ngoại, nhận diện chính xác và rõ ràng hơn.

Kĩ thuật nhận diện 3D về cơ bản sẽ có các thiết bị quét khuôn mặt (ví dụ như trên iPhone) tạo ra một ma trận IR trên khuôn mặt của người dùng. Ma trận này phản chiếu lại hình ảnh khuôn mặt người dùng và được camera hồng ngoại nhận lấy sau đó sẽ là công việc của các phần mềm, đo đạc thông số, xác thực lại thông tin để phục vụ cho mục đích cuối cùng.

Chi tiết hơn, camera IR sẽ đo thời gian để ánh sáng hồng ngoại từ camera đi đến khuôn mặt và bật lại vào camera. Ví dụ như mũi là phần gương mặt bị ‘nhô cao’ ra phía trước nên ánh sáng hồng ngoại sẽ có thời gian ngắn hơn do quãng đường đi ngắn hơn, tương tự là tai sẽ có hành trình dài hơn và thời gian lâu hơn từ đây camera IR sử dụng các thông tin này để tạo ra một bản đồ siêu độc đáo cho khuôn mặt của bạn. Sau cùng nó sẽ kết hợp với hình ảnh 2D, và hình ảnh 3D có chiều sâu để làm tăng mức độ chính xác của phần mềm nhận dạng khuôn mặt.

Hình ảnh nhiệt cho phép nhận dạng khuôn mặt vào cả ban đêm

Một trong những điểm yếu của nhận diện 2D đã được 3D giải quyết đó là việc phụ thuộc vào ánh sáng, về cơ bản nhận diện khuôn mặt không thể hoạt động trong môi trường thiếu sáng. Nhưng nếu nhận diện bằng ảnh nhiệt thì chuyện này hoàn toàn có thể giải quyết được (giống như trong phim khoa học viễn tưởng hay thể loại hành động mà bạn thường xem).

Những vật nóng phát ra ‘hàng tấn’ ánh sáng hồng ngoại, còn các vật lạnh thì lại không đáng kể, với camera nhiệt ‘xịn xò’ hoàn toàn có thể đưa ra sự đổi khác của nhiệt độ trên một bề mặt vì vậy đây là một công nghệ lí tưởng và phù hợp cho nhận dạng khuôn mặt.

Với nhiều cách khác nhau để nhận diện khuôn mặt bằng ảnh nhiệt nhưng nó vẫn khá phức tạp:

Cần nhiều hình ảnh: Ảnh nhiệt phục vụ cho mục đích nhận dạng sẽ cần đến nhiều hình ảnh của khuôn mặt. Mỗi hình ảnh sẽ được đo với nhiều bước sóng khác nhau (dài, ngắn,..). Thông thường bước sóng dài sẽ cung cấp nhiều chi tiết hơn bước sóng ngắn sẽ cung cấp ra những chi tiết ‘độc đáo’ và khi gộp chung lại sẽ là một bức tranh chính xác, đầy đủ dành cho máy để nhận diện.

Nhận diện luôn cả các mạch máu: Hình ảnh hồng ngoại cũng có thể trích xuất ra được bản đồ của các mạch máu người, mặc dù nhìn hơi ghê và cũng không kém rối rắm nhưng đặc điểm này là riêng biệt và hoàn toàn có thể sử dụng như một ‘dấu vân tay’ trên cơ thể người, cùng đó khi có được bản đồ ‘này’ thì máy móc có thể tìm được khoảng cách giữa các cơ quan trên khuôn mặt trong trường hợp ảnh nhiệt có chất lượng kém, ngoài ra nó cũng là cách để xác định các vết bầm, vết sẹo trên cơ thể.

Định danh chủ thể: Đó là tất cả những thông tin IR, hình ảnh 2D gom lại thành một tập dữ liệu khổng lồ ở mức độ ‘đủ’ để so sánh với cơ sở dữ liệu khuôn mặt để xác định đối tượng. Để việc này có thể xảy ra sẽ cần một cơ sở dữ liệu khổng lồ và siêu máy tính để nhận diện.

Và điều dĩ nhiên, nhận diện khuôn mặt qua ảnh nhiệt chỉ thường được sử dụng bởi quân đội, và ‘thứ này’ không phải là ‘thứ’ có thể trang bị dễ dàng vào điện thoại hay được ứng dụng vào điện thoại bởi vì nó phức tạp và mang đến nhiều trở ngại trong môi trường thông thường đối với người dùng, đơn giản như việc sử dụng vào buổi sáng/ban ngày là việc không thể nên quân đội mới là đích đến của nó.

Những hạn chế của nhận diện khuôn mặt

Vật cản: Máy móc hoá một phần mềm thì nó nhận diện theo kiểu máy móc, có nghĩa là đầu vào ghi nhận thông tin thế nào thì lúc xác thực sẽ cần đúng thông tin như vậy, với việc bạn đeo kính, mang khẩu trang, đội nón,.. sẽ cản trở quá trình xác thực và cần đến máy học để giải quyết nhưng nó vẫn là máy nên vẫn đang được ‘đào tạo’ hằng ngày để trở nên thông minh hơn.

Trực diện: Nhận dạng khuôn mặt hoạt động tốt nhất với hình ảnh ‘bình thường’, đó là hướng về phía trước – đối diện camera. Việc nghiêng hay xoay/lệch đầu có thể làm việc nhận dạng khuôn mặt trở nên khó khăn hơn ngay cả đó là nhận diện từ IR. Ngoài ra bất kì sự thay đổi hình thể nào sai khác với xác thực ban đầu cũng làm nhận diện khó khăn hơn như cười, sưng tấy khuôn mặt cũng đủ để thay đổi cách máy tính đo khuôn mặt của bạn.

Ánh sáng: Tất cả các phương thức nhận diện đều dựa trên ánh sáng, dù là nhìn thấy hay không nhìn thấy. Do đó, điều kiện ánh sáng có thể làm giảm độ chính xác của nhận dạng khuôn mặt, với công nghệ phát triển các nhà khoa học đang nghiên cứu về nhận dạng khuôn mặt dựa trên sóng (lan truyền sóng để thu nhận tính hiệu) nhưng thời điểm đó vẫn còn xa.

Cơ sở dữ liệu: Nếu không có một cơ sở dữ liệu tốt, nhận dạng khuôn mặt có tốt thì cũng không thể xác thực được một khuôn mặt khi đã đủ thông tin ở hiện tại.

Xử lí dữ liệu: Như mình đã nói ở trên ở mức độ nào đó thì máy tính sẽ tốn nhiều hay ít thời gian hơn để xác định chính xác khuôn mặt, trong tình huống là Face ID thì nó nhỏ và nhanh hơn rất nhiều để phù hợp sử dụng hằng ngày còn với dân số một quốc gia thì siêu máy tính cũng cần đến vài cái mới đủ.

Trong tương lai, việc đưa ra các phương thức nhận diện khuôn mặt khác với hiện tại đang được tiến hành nghiên cứu, nhưng với mức độ ‘vui vẻ’ bảo mật cho một cá nhân thì các công ty như Apple đang làm khá tốt để phục vụ nhu cầu hằng ngày, còn tương lai với mức độ cao hơn, đòi hỏi công nghệ cao hơn, phức tạp hơn, tinh vi hơn hoàn toàn có thể sử dụng cho cả mục đích tốt và xấu như dùng cho chính phủ để xác minh kẻ phạm tội hoặc cũng là bị sử dụng cho deepfake để tống tiền.