Computer Vision - Thị giác máy tính là gì? Thị giác máy tính là lĩnh vực khoa học máy tính tập trung vào việc tái tạo hoặc mô phỏng các phần phức tạp của hệ thống thị giác con người và cho phép máy tính xác định và hiển thị các đối tượng trên biểu đồ. Xem hình ảnh và video theo cách con người nhìn và cảm nhận thế giới hình ảnh. Computer Vision có lịch sử hình thành từ những năm 1950 và thực sự bùng nổ khi Internet phát triển vào những năm 1990. Tuy nhiên, do thiếu điều kiện phát triển lúc bấy giờ nên Computer Vision tỏ ra hạn chế và bị lãng quên. Ngày nay, sự tác động lẫn nhau của một số yếu tố đang dẫn đến sự phục hưng thị giác máy tính: Phần cứng được thiết kế dành riêng cho thị giác máy tính và phân tích phổ biến hơn bao giờ hết. Một lượng dữ liệu đồ họa khổng lồ, khoảng 3 tỷ hình ảnh và video được chia sẻ trực tuyến mỗi ngày Các thuật toán mới, chẳng hạn như mạng thần kinh tích lũy, có thể tận dụng các tài nguyên được cung cấp bởi cả phần cứng và phần mềm. Máy tính bây giờ có giá cả phải chăng hơn và sẵn có. Những tiến bộ này đã đưa thị giác máy tính đi rất xa. Tỷ lệ nhận dạng và phân loại đối tượng đã tăng từ 50% lên 99% trong vòng chưa đầy 10 năm – và các hệ thống ngày nay có thể nhanh chóng nhận dạng và phản hồi các đầu vào trực quan chính xác hơn con người có thể. Đến năm 2022, thị trường phần cứng và thị giác máy tính dự kiến sẽ đạt 48,6 tỷ USD Trong những năm gần đây, việc ứng dụng Deep Learning/Machine Learning đã giúp Computer Vision có những bước nhảy vọt, vượt xa khả năng tái tạo và mô phỏng tầm nhìn của con người. Thị giác máy tính hoạt động như thế nào? Công nghệ thị giác máy tính có xu hướng mô phỏng cách bộ não con người hoạt động khi nhìn vào thế giới hình ảnh. Nhưng làm thế nào để bộ não của chúng ta xử lý nhận dạng đối tượng trực quan? Một trong những lý thuyết phổ biến nói rằng bộ não con người phụ thuộc vào các mẫu để giải mã các đối tượng riêng lẻ trong từng trường hợp. Khái niệm này được sử dụng để tạo ra các hệ thống Computer Vision. Các thuật toán thị giác máy tính mà chúng ta sử dụng ngày nay dựa trên nhận dạng mẫu. Con người đào tạo máy tính dựa trên lượng dữ liệu hình ảnh khổng lồ – máy tính xử lý hình ảnh, gắn nhãn các đối tượng trong đó và tìm các mẫu trong các đối tượng đó. Ví dụ: nếu bạn tải lên một triệu hình ảnh về các bông hoa, máy tính sẽ phân tích chúng, xác định các mẫu giống với tất cả các bông hoa và khi kết thúc quá trình, tạo ra một mẫu "bông hoa". Do đó, máy tính sẽ có thể phát hiện chính xác liệu một hình ảnh nhất định có phải là một bông hoa hay không mỗi khi ai đó gửi ảnh để phân tích. Golan Levin, trong bài viết Xử lý hình ảnh và thị giác máy tính, cung cấp các chi tiết kỹ thuật về quy trình mà máy móc tuân theo trong quá trình phân tích hình ảnh. Nói tóm lại, máy diễn giải hình ảnh dưới dạng một chuỗi các pixel, mỗi pixel có một bộ giá trị màu riêng. Ví dụ, dưới đây là một bức ảnh của Abraham Lincoln. Độ sáng của mỗi pixel trong hình ảnh này được biểu thị bằng một số 8 bit, nằm trong khoảng từ 0 (đen) đến 255 (trắng). Những con số này là những gì phần mềm nhìn thấy khi bạn nhập một hình ảnh. Những dữ liệu này được cung cấp làm đầu vào cho thuật toán thị giác máy tính sẽ chịu trách nhiệm phân tích thêm và ra quyết định. Xem thêm bài viết tại: https://ipc247.com/computer-vision-thi-giac-may-tinh-la-gi/ Tìm hiểu thêm về IPC247 tại: Địa chỉ: 39 Nguyễn Bỉnh Khiêm, Phường 1, Gò Vấp, Thành phố Hồ Chí Minh SĐT: 02871097868 Google map: https://www.google.com/maps?cid=7149257793200023467 Socials: https://www.crunchbase.com/organization/ipc247 https://www.tiktok.com/tag/ipc247 https://www.4shared.com/u/6mJd6roi/maytinhcongnghiepipc247vn.html