AI của Facebook có thể tạo video từ văn bản

Mark Zuckerberg đã đăng trên Facebook vào ngày 29 tháng 9 rằng “tất cả những video này được tạo ra bởi một hệ thống AI mà chúng tôi gọi là Make-A-Video. Bạn chỉ cần cung cấp cho nó một mô tả và nó sẽ tạo ra video phù hợp cho bạn. "

AI của Facebook có thể tạo video từ văn bản
 
 
AI được Meta sử dụng để tạo video từ văn bản

Zuckerberg đã đăng một video Make-A-Video trên Facebook

Chương trình AI mới do Meta phát triển có thể tạo ra những video có nội dung rất ngắn chỉ trong vòng 20 giây, chẳng hạn như "Robot đang lướt sóng trên đại dương", "Tàu vũ trụ hạ cánh trên sao Hỏa" hay "Gấu bông vẽ hình tự . "

Do hệ thống phải tạo chính xác từng pixel cũng như dự đoán chúng sẽ thay đổi như thế nào theo thời gian, Zuckerberg cho rằng việc tạo video từ văn bản khó hơn nhiều so với chuyển văn bản thành hình ảnh.

Đoạn video CEO Meta đăng tải trên trang cá nhân được đánh giá là chưa hoàn chỉnh do độ phân giải thấp, khung hình bị giật và chuyển động của nhân vật không đồng nhất, nhưng nó thể hiện một cách tiếp cận mới trong nghiên cứu AI để chuyển văn bản thành video

Các chuyên gia tin rằng việc tạo video trong tương lai với các công cụ như Make-A-Video sẽ đơn giản hơn nhiều, đặc biệt là khi chúng liên tục được cải thiện theo thời gian, nhưng họ cũng lo ngại rằng chúng sẽ bị lạm dụng.

Đối với các hệ thống chuyển văn bản thành hình ảnh, nếu công nghệ này được sử dụng rộng rãi, nó sẽ làm nảy sinh một số vấn đề, chẳng hạn như khả năng lan truyền thông tin sai lệch. Video sẽ khó kiểm soát hơn nhiều so với hình ảnh, theo CNN

Một chuyên gia khác khẳng định rằng vì các mô hình AI chuyển văn bản thành hình ảnh được đào tạo bằng dữ liệu Internet, nên các thành kiến ​​xã hội có thể được khuếch đại bởi chúng. Có thể có hàng triệu hình ảnh và từ trong bộ dữ liệu cho video, khiến cho việc loại bỏ hoặc kiểm soát hoàn toàn là không thể

Trong tương lai, theo Zuckerberg, anh sẽ chia sẻ dự án Make-A-Video dưới dạng mã nguồn mở, nhưng anh không đề cập đến cách giảm tác động tiêu cực của nó.

Hôm nay, chúng tôi xin công bố Make-A-Video, một hệ thống AI mới cho phép mọi người biến lời nhắc văn bản thành các video ngắn chất lượng cao. Make-A-Video dựa trên tiến bộ gần đây của Meta AI trong nghiên cứu công nghệ tổng quát và có khả năng mở ra cơ hội mới cho người sáng tạo và nghệ sĩ. Hệ thống tìm hiểu thế giới trông như thế nào từ dữ liệu hình ảnh văn bản được ghép nối và cách thế giới di chuyển từ cảnh quay video không có văn bản liên quan. Là một phần trong cam kết liên tục của chúng tôi đối với khoa học mở, chúng tôi đang chia sẻ chi tiết trong một bài báo nghiên cứu và có kế hoạch phát hành trải nghiệm demo

Nghiên cứu AI sáng tạo đang thúc đẩy sự thể hiện sáng tạo bằng cách cung cấp cho mọi người các công cụ để tạo nội dung mới một cách nhanh chóng và dễ dàng. Chỉ với một vài từ hoặc dòng văn bản, Make-A-Video có thể biến trí tưởng tượng thành hiện thực và tạo ra những video độc nhất vô nhị với màu sắc, nhân vật và phong cảnh sống động. Hệ thống cũng có thể tạo video từ hình ảnh hoặc lấy video có sẵn và tạo video mới tương tự

Make-A-Video theo thông báo của chúng tôi vào đầu năm nay về Make-A-Scene, một phương pháp AI tạo ra đa phương thức cho phép mọi người kiểm soát nhiều hơn đối với nội dung do AI tạo ra mà họ tạo ra. Với Make-A-Scene, chúng tôi đã trình bày cách mọi người có thể tạo các hình minh họa chân thực và tác phẩm nghệ thuật chất lượng như sách truyện bằng cách sử dụng các từ, dòng văn bản và bản phác thảo dạng tự do

Chúng tôi muốn suy nghĩ kỹ về cách chúng tôi xây dựng các hệ thống AI thế hệ mới như thế này. Make-A-Video sử dụng các bộ dữ liệu có sẵn công khai, giúp tăng thêm mức độ minh bạch cho nghiên cứu. Chúng tôi chia sẻ cởi mở kết quả và nghiên cứu AI tổng quát này với cộng đồng để nhận phản hồi của họ và sẽ tiếp tục sử dụng khuôn khổ AI có trách nhiệm của mình để tinh chỉnh và phát triển cách tiếp cận của chúng tôi đối với công nghệ mới nổi này

Tìm hiểu thêm về Make-A-Video bằng cách truy cập trang web của chúng tôi và đọc báo

Dưới đây là một số ví dụ về lời nhắc văn bản được chuyển thành video

AI của Facebook có thể tạo video từ văn bản

Trên cùng bên trái. Một con chó mặc áo choàng siêu anh hùng bay trên bầu trời. Trên cùng bên phải. Một con tàu vũ trụ hạ cánh trên sao Hỏa. Dưới cùng bên trái. Tranh cọ vẽ của một nghệ sĩ trên vải vẽ cận cảnh, rất chi tiết. Góc phải ở phía dưới. Một con ngựa uống nước

hệ thống Make-A-Video tân tiến nhất. Nó được xây dựng dựa trên những tiến bộ gần đây mà công nghệ tạo văn bản thành hình ảnh đã trải qua, sử dụng các mô tả để tạo ra các hình ảnh chuyển động từ các văn bản. Meta đã có những bước tiến vượt bậc khi tham gia vào nhóm và cho phép khán giả tạo GIF hoặc video của riêng họ chỉ bằng một vài từ hoặc dòng văn bản

 

Một số mô tả mà nhóm đã thử bao gồm 'Một chú chó mặc trang phục Siêu anh hùng với áo choàng đỏ bay trên bầu trời', 'Con mèo đang xem TV với chiếc điều khiển trên tay, . ’ , and ‘A fluffy baby sloth with an orange knitted hat trying to figure out a laptop close up highly detailed studio lighting screen reflecting in its eye.’ Hai cái đầu tiên dường như đã tạo ra những hình ảnh chính xác chỉ với một vài từ trong khi hai cái sau, mặc dù cũng tạo ra những hình ảnh chính xác, cần nhiều chi tiết hơn. Tuy nhiên, những hình ảnh chuyển động được tạo ra đã ghi lại các mô tả từ các văn bản của nhóm.

AI của Facebook có thể tạo video từ văn bản

hình ảnh lịch sự của Meta AI

 

 

Nhiều nội dung internet hơn cho người sáng tạo và nghệ sĩ

 

Meta nói rằng Make-A-Video mở ra cơ hội cho những người sáng tạo nội dung và nghệ sĩ bằng cách cung cấp cho họ các công cụ để tạo nội dung mới một cách nhanh chóng và dễ dàng thông qua AI tổng hợp. ‘Hệ thống tìm hiểu thế giới trông như thế nào từ dữ liệu văn bản-hình ảnh được ghép nối và cách thế giới chuyển động từ cảnh quay video không có văn bản liên quan’, Meta viết. Hệ thống cũng có thể tạo video từ hình ảnh hoặc lấy video có sẵn tạo video mới tương tự. Lấy ví dụ, hình ảnh tiêu đề của bài viết này trong đó hình ảnh bên trái là hình ảnh hiện có trong khi hình ảnh bên phải là những gì Make-A-Video tạo ra, một hình ảnh chuyển động được chỉnh sửa với vô số hiệu ứng nâng cao khuôn mặt. ‘Chúng tôi muốn suy nghĩ kỹ về cách chúng tôi xây dựng các hệ thống AI tổng quát mới như thế này’ Meta cho biết thêm.

AI của Facebook có thể tạo video từ văn bản

một con chó mặc trang phục siêu anh hùng với áo choàng đỏ bay trên bầu trời

 

 

Bộ dữ liệu và nghiên cứu có sẵn công khai

 

Người dùng cũng có thể tải lên hình ảnh tĩnh và Make-A-Video từ Meta sẽ biến hình ảnh đó thành hình ảnh chuyển động nhờ công nghệ AI tổng hợp. Make-A-Video sử dụng các tập dữ liệu có sẵn công khai và Meta đang chia sẻ công khai nghiên cứu AI chung của mình và kết quả với cộng đồng để nhận phản hồi của họ. Công ty cho biết họ sẽ tiếp tục sử dụng khuôn khổ AI có trách nhiệm của chúng tôi để tinh chỉnh và phát triển cách tiếp cận của chúng tôi đối với công nghệ mới nổi này. ’ Dữ liệu nguồn của Make-A-Video phân tích hàng triệu mẩu dữ liệu để tìm hiểu về thế giới. Để giảm nguy cơ nội dung độc hại được tạo ra, nhóm kiểm tra, áp dụng và lặp lại các bộ lọc để giảm nguy cơ nội dung độc hại xuất hiện trong video. Meta thêm hình mờ của nó vào mỗi video mà nó tạo ra là có lý do.

AI có thể tạo video không?

Hôm nay, chúng tôi xin công bố Tạo video, một hệ thống AI mới cho phép mọi người biến lời nhắc văn bản thành các video clip ngắn, chất lượng cao. Make-A-Video builds on Meta AI's recent progress in generative technology research and has the potential to open new opportunities for creators and artists.

AI chuyển văn bản thành video hoạt động như thế nào?

Đúng như tên gọi, mô hình AI này cho phép người dùng nhập mô tả sơ bộ về cảnh và mô hình này sẽ tạo ra một video ngắn phù hợp với văn bản của họ. The videos are clearly artificial, with blurred subjects and distorted animation, but still represent a significant development in the field of AI content generation.

AI được sử dụng như thế nào trong video?

Phân tích video AI . Hoạt động với các phân loại đối tượng như người, ô tô và biển số xe trong nguồn cấp dữ liệu hình ảnh và video trong thời gian thực. Increase insights from data in video files by using AI to automatically detect, analyze, and interpret activity in real time. Works with classifications of object such as people, cars, and license plates within image and video feeds in real time.

Meta AI làm gì?

Meta AI dự định phát triển các dạng trí tuệ nhân tạo khác nhau, cải thiện công nghệ thực tế tăng cường và nhân tạo . Meta AI là một phòng thí nghiệm nghiên cứu học thuật tập trung vào việc tạo ra kiến ​​thức cho cộng đồng AI.