60+ Câu lệnh SORA OpenAI chatgpt để tạo Video, tạo nội dung hình ảnh

Trong chuyên đề này, sẽ liên tục cập nhật mới những câu lệnh SORA OPENAI chatgpt để tạo Video, media, hình ảnh. Bạn nên lưu nội dung này trên màn hình điện thoại di động tiện cho sử dụng lâu dài về sau nhé.

Những câu lệnh này được chuyển thể từ nhiều ngôn ngữ (không chỉ tiếng Anh, mà còn tiếng Nhật Bản, Tiếng Đức, tiếng Trung Quốc, tiếng Hàn Quốc…) sang Tiếng Việt Nam. Vì vậy bạn nên chỉnh sửa một số từ để phù hợp với nhu cầu của mình, tạo ra thước phim Video hiệu quả hơn.

Trước tiên chúng ta hãy check và xem một số video do SORA OpenAI tạo ra qua Youtube, từ đó hiểu nắm bắt được những sản phẩm thực do Sora làm:

Để chứng tỏ sức mạnh của mình, OpenAI cũng đã phát hành 48 video chưa sửa đổi do Sora tạo trực tiếp trên trang web chính thức của mình.

Độ dài của các video này dao động từ 8 đến 60 giây, chất lượng hình ảnh phù hợp với Câu lệnh và hiệu ứng bùng nổ. Bạn bè quan tâm có thể vào trang web chính thức để kiểm tra.

Link trang web chính thức: https://openai.com/sora

Tiếp theo chúng tôi sẽ giới thiệu các câu lệnh SORA OpenAI chatgpt để tạo Video :

Bạn lưu ý, đây là những câu lệnh tiếng Việt,  ngôn ngữ mà Sora có thể chưa hỗ trợ hiệu quả so với câu lệnh tiếng Anh, vì vậy bạn cần sửa chữa một số chỗ để đạt được mục tiêu video/hình ảnh của mình.

01

Câu lệnh 1: Một người phụ nữ sành điệu bước xuống một con phố ở Tokyo tràn ngập ánh đèn neon rực rỡ ấm áp và biển hiệu thành phố hoạt hình. Cô ấy mặc áo khoác da màu đen, váy dài màu đỏ, đi bốt đen và mang theo một chiếc ví màu đen. Cô đeo kính râm và tô son đỏ. Cô bước đi tự tin và thản nhiên. Đường phố ẩm ướt và phản chiếu, tạo ra hiệu ứng phản chiếu của ánh đèn nhiều màu sắc. Nhiều người đi bộ đi lại.

>> Tìm hiểu tất cả về SORA của OpenAi. SORA OpenAi Là gì? Chi tiết về Sora

02

Câu lệnh 2: Một số con voi ma mút khổng lồ bước đến trên một đồng cỏ đầy tuyết, bộ lông dài của chúng tung bay nhẹ trong gió khi chúng bước đi, những cái cây phủ đầy tuyết và những ngọn núi phủ tuyết ấn tượng ở phía xa, ánh sáng giữa buổi chiều với những đám mây mỏng manh và mặt trời trên cao khoảng cách tạo ra ánh sáng ấm áp, chế độ xem camera thấp rất ấn tượng, chụp được loài động vật có vú lớn có lông với khả năng chụp ảnh đẹp, độ sâu trường ảnh.

03

Câu lệnh  3: Đoạn giới thiệu phim kể về cuộc phiêu lưu của người đàn ông ngoài không gian 30 tuổi đội mũ bảo hiểm xe máy dệt kim len màu đỏ, bầu trời xanh, sa mạc muối, phong cách điện ảnh, quay trên phim 35mm, màu sắc sống động.

04

Câu lệnh  4: Cảnh nhìn từ máy bay không người lái về những con sóng vỗ vào những vách đá gồ ghề dọc theo bãi biển garay point của Big Sur. Làn nước xanh vỗ tạo nên những con sóng trắng xóa, trong khi ánh sáng vàng của mặt trời lặn chiếu sáng bờ đá. Xa xa là một hòn đảo nhỏ có ngọn hải đăng và những bụi cây xanh bao phủ mép vách đá. Đoạn dốc từ con đường xuống bãi biển là một kỳ công ấn tượng, với các cạnh của vách đá nhô ra biển. Đây là khung cảnh ghi lại vẻ đẹp nguyên sơ của bờ biển và phong cảnh gồ ghề của Đường cao tốc Bờ biển Thái Bình Dương.

05

Câu lệnh 5: Cảnh hoạt hình có cận cảnh một con quái vật lông ngắn đang quỳ bên cạnh ngọn nến đỏ đang tan chảy. Phong cách nghệ thuật là 3D và hiện thực, tập trung vào ánh sáng và kết cấu. Tâm trạng của bức tranh là sự ngạc nhiên và tò mò, khi con quái vật nhìn chằm chằm vào ngọn lửa với đôi mắt mở to và miệng há hốc. Tư thế và biểu cảm của nó truyền tải cảm giác ngây thơ và vui tươi, như thể nó đang khám phá thế giới xung quanh lần đầu tiên. Việc sử dụng màu sắc ấm áp và ánh sáng ấn tượng càng làm tăng thêm bầu không khí ấm cúng của hình ảnh.

>> Tìm hiểu tất cả về: DALL E và DALL E 3, DALL E 2 của OpenAI. Sử dụng thế nào, DALL E Free

06

Câu lệnh 6: Một thế giới giấy thủ công được thể hiện tuyệt đẹp về một rạn san hô, đầy rẫy những loài cá và sinh vật biển đầy màu sắc.

07

Câu lệnh  7:  Ảnh chụp cận cảnh một con chim bồ câu đội vương miện Victoria cho thấy bộ lông màu xanh nổi bật và bộ ngực màu đỏ của nó. Mào của nó được làm bằng những chiếc lông ren mỏng manh, trong khi mắt của nó có màu đỏ nổi bật. Đầu chim hơi nghiêng sang một bên tạo cảm giác vương giả và uy nghiêm. Hậu cảnh được làm mờ, thu hút sự chú ý vào vẻ ngoài nổi bật của chú chim.

08

Câu lệnh  8: Video cận cảnh chân thực về hai con tàu cướp biển đang chiến đấu với nhau khi chúng di chuyển bên trong một tách cà phê.

09

Gợi ý  9: Một thanh niên khoảng 20 tuổi đang ngồi trên một đám mây trên bầu trời và đọc sách.

10

Câu lệnh  10: Đoạn phim lịch sử về California trong cơn sốt vàng.

11

Câu lệnh  11: Cận cảnh một quả cầu thủy tinh có khu vườn thiền bên trong. Có một chú lùn nhỏ trong quả cầu đang cào khu vườn thiền và tạo ra những hoa văn trên cát.

Câu lệnh tiếng Trung số 11: Cận cảnh quả cầu thủy tinh với khu vườn Thiền bên trong. Quả cầu chứa một người lùn đang cào một khu vườn thiền và tạo ra các hoa văn trên cát.

12

Câu lệnh  12: Cận cảnh một người phụ nữ 24 tuổi chớp mắt, đứng ở Marrakech trong giờ ma thuật, phim điện ảnh quay ở 70mm, độ sâu trường ảnh, màu sắc sống động, đậm chất điện ảnh

13

Câu  13: Phim hoạt hình kangaroo nhảy disco.

14

Câu lệnh  14: Một đoạn video tự quay tuyệt đẹp về người dân Lagos, Nigeria vào năm 2056. Được quay bằng camera điện thoại di động.

15

Câu lệnh  15: Một đĩa petri có một rừng tre mọc bên trong và có những chú gấu trúc nhỏ màu đỏ chạy xung quanh.

16

Câu lệnh  16: Máy ảnh quay xung quanh một chồng lớn tivi cổ điển, tất cả đều chiếu các chương trình khác nhau – phim khoa học viễn tưởng những năm 1950, phim kinh dị, tin tức, phim tĩnh, phim sitcom những năm 1970, v.v., đặt bên trong một phòng trưng bày bảo tàng lớn ở New York.

17

Câu lệnh  17: Hoạt hình 3D về một sinh vật nhỏ, tròn trịa, có lông tơ với đôi mắt to đầy biểu cảm đang khám phá một khu rừng rực rỡ đầy mê hoặc. Sinh vật này là sự pha trộn kỳ lạ giữa thỏ và sóc, có bộ lông màu xanh mềm mại và chiếc đuôi sọc rậm rạp. Nó nhảy dọc theo một dòng suối lấp lánh, đôi mắt mở to ngạc nhiên. Khu rừng sống động với các yếu tố kỳ diệu: hoa phát sáng và thay đổi màu sắc, cây có lá màu tím và bạc, và những ngọn đèn nhỏ lơ lửng giống như đom đóm. Sinh vật này dừng lại để tương tác vui vẻ với một nhóm sinh vật nhỏ bé giống như thần tiên đang nhảy múa xung quanh một vòng nấm. Sinh vật này kinh ngạc nhìn lên một cái cây lớn, phát sáng dường như là trung tâm của khu rừng.

18

Câu lệnh Sora OpenAi 18: Camera theo sau một chiếc SUV cổ điển màu trắng với giá nóc màu đen khi nó tăng tốc trên con đường đất dốc được bao quanh bởi những cây thông trên một sườn núi dốc, bụi bay lên từ lốp xe, ánh nắng chiếu vào chiếc SUV khi nó tăng tốc dọc theo con đường đất, tỏa ánh sáng ấm áp khắp khung cảnh. Con đường đất uốn lượn nhẹ nhàng về phía xa, không có ô tô, phương tiện nào khác trong tầm mắt. Hai bên đường là cây gỗ đỏ, rải rác khắp nơi là những mảng cây xanh. Chiếc xe được nhìn thấy từ phía sau theo đường cong một cách dễ dàng, khiến nó có vẻ như đang lái xe gồ ghề qua địa hình hiểm trở. Con đường đất được bao quanh bởi những ngọn đồi và núi dốc, với bầu trời trong xanh phía trên với những đám mây mỏng manh.

19

Câu lệnh  19: Hình ảnh phản chiếu trên cửa sổ một chuyến tàu đi qua vùng ngoại ô Tokyo.

20

Câu lệnh  20: Máy quay không người lái quay vòng quanh một nhà thờ lịch sử xinh đẹp được xây dựng trên mỏm đá dọc theo Bờ biển Amalfi, khung cảnh thể hiện các chi tiết kiến ​​trúc lịch sử và tráng lệ cũng như các lối đi và sân hiên có nhiều tầng, sóng vỗ vào những tảng đá bên dưới khi tầm nhìn nhìn ra đường chân trời trong vùng nước ven biển và phong cảnh đồi núi của Bờ biển Amalfi nước Ý, người ta nhìn thấy một số người ở xa đang đi bộ và tận hưởng khung cảnh trên sân nhìn ra khung cảnh đại dương ấn tượng, ánh sáng ấm áp của mặt trời buổi chiều tạo ra cảm giác kỳ diệu và lãng mạn cho khung cảnh, quang cảnh thật tuyệt vời tuyệt đẹp được chụp bằng nhiếp ảnh đẹp.

21

Gợi ý  21: Người ta nhìn thấy một con bạch tuộc lớn màu cam đang nằm dưới đáy đại dương, hòa vào địa hình cát và đá. Các xúc tu của nó trải rộng khắp cơ thể và đôi mắt nhắm nghiền. Con bạch tuộc không hề hay biết một con cua hoàng đế đang bò về phía nó từ phía sau một tảng đá, móng vuốt giơ lên ​​và sẵn sàng tấn công. Cua có màu nâu và nhiều gai, chân và râu dài. Khung cảnh được chụp từ góc rộng, cho thấy sự rộng lớn và sâu thẳm của đại dương. Nước trong xanh, có tia nắng xuyên qua. Ảnh chụp sắc nét và sắc nét, có dải động cao. Con bạch tuộc và con cua được lấy nét, trong khi hậu cảnh hơi mờ, tạo ra hiệu ứng độ sâu trường ảnh.

22

Gợi ý  22: Một đàn máy bay giấy bay qua khu rừng rậm rạp, len lỏi quanh những tán cây như thể chúng đang di cư.

23

Câu  23: Một con mèo đánh thức người chủ đang ngủ của nó và đòi ăn sáng. Người chủ cố gắng phớt lờ con mèo, nhưng con mèo thử chiến thuật mới và cuối cùng người chủ lấy ra một kho đồ ăn bí mật dưới gối để giữ con mèo lâu hơn một chút.

24

Câu lệnh  24: Đời sống hoang dã ở Borneo

25

Câu lệnh  25: Video ăn mừng Tết Nguyên Đán với Rồng Trung Hoa.

26

Câu lệnh  26: Tham quan phòng trưng bày nghệ thuật với nhiều tác phẩm nghệ thuật đẹp theo nhiều phong cách khác nhau.

27

Câu lệnh OpenAi Sora chatgpt tạo Video 27: Thành phố Tokyo xinh đẹp đầy tuyết đang nhộn nhịp. Máy ảnh di chuyển qua con phố nhộn nhịp của thành phố, theo chân một số người đang tận hưởng thời tiết tuyết rơi tuyệt đẹp và mua sắm tại các quầy hàng gần đó. Những cánh hoa anh đào tuyệt đẹp đang bay trong gió cùng với những bông tuyết.

28

Câu lệnh  28: Hoạt hình dừng chuyển động về một bông hoa mọc ra từ bậu cửa sổ của một ngôi nhà ở ngoại ô.

29

Câu lệnh  29: Câu chuyện về cuộc sống của một robot trong bối cảnh cyberpunk.

30

Câu lệnh  30: Cận cảnh một người đàn ông tóc bạc có bộ râu ở độ tuổi 60, ông ta đang suy nghĩ sâu sắc về lịch sử của vũ trụ khi ngồi tại một quán cà phê ở Paris, mắt ông ta tập trung vào những người ngoài màn hình khi họ bước đi Khi anh ấy ngồi gần như bất động, anh ấy mặc một chiếc áo khoác len với áo sơ mi cài cúc, anh ấy đội một chiếc mũ nồi màu nâu và đeo kính, có vẻ ngoài rất chuyên nghiệp, và cuối cùng anh ấy nở một nụ cười kín miệng tinh tế như thể anh ấy đã tìm ra câu trả lời cho bí ẩn của cuộc sống, ánh sáng rất điện ảnh với ánh sáng vàng và hậu cảnh là đường phố và thành phố Paris, độ sâu trường ảnh, phim 35mm đậm chất điện ảnh.

31

Câu lệnh  31: Một hình ảnh động tuyệt đẹp cho thấy một con sói đang hú trên mặt trăng, cảm thấy cô đơn cho đến khi nó tìm thấy đàn của mình.

32

Câu lệnh Sora OpenAi 32: Thành phố New York chìm trong nước như Atlantis. Cá, cá voi, rùa biển và cá mập bơi lội trên đường phố New York.

33

Câu lệnh  33: Một lứa chó tha mồi vàng đang chơi đùa trong tuyết. Đầu của họ nhô ra khỏi tuyết và được bao phủ trong tuyết.

34

Câu lệnh  34: Máy ảnh hướng thẳng vào các tòa nhà đầy màu sắc ở Burano Italy. Một chú chó đốm đáng yêu nhìn qua cửa sổ của một tòa nhà ở tầng trệt. Nhiều người đang đi bộ và đạp xe dọc theo những con đường kênh trước các tòa nhà.

35

Câu lệnh 35: Một chú rái cá vui vẻ đáng yêu tự tin đứng trên ván lướt sóng với chiếc áo phao màu vàng, cưỡi ngựa dọc theo vùng nước nhiệt đới màu ngọc lam gần những hòn đảo nhiệt đới tươi tốt, phong cách nghệ thuật kết xuất kỹ thuật số 3D.

36

Câu lệnh Sora tạo Video 36: Ảnh chụp cận cảnh một con tắc kè hoa thể hiện khả năng thay đổi màu sắc ấn tượng của nó. Hậu cảnh được làm mờ, thu hút sự chú ý vào vẻ ngoài nổi bật của con vật.

37

Câu lệnh  37: Một chú chó corgi đang làm vlog ở vùng nhiệt đới Maui.

38

Gợi ý  38: Một con mèo mướp màu trắng và cam được nhìn thấy đang vui vẻ phóng qua một khu vườn rậm rạp, như thể đang đuổi theo thứ gì đó. Đôi mắt của nó mở to và vui vẻ khi nó chạy về phía trước, quan sát cành, hoa và lá khi nó bước đi. Con đường hẹp vì nó đi giữa tất cả các loài thực vật. khung cảnh được chụp từ góc trên mặt đất, theo sát con mèo, mang lại góc nhìn thấp và thân mật. Hình ảnh mang tính điện ảnh với tông màu ấm và kết cấu nổi hạt. Ánh sáng ban ngày rải rác giữa lá và cây phía trên tạo nên sự tương phản ấm áp, làm nổi bật bộ lông màu cam của chú mèo. Ảnh rõ ràng và sắc nét, với độ sâu trường ảnh nông.

39

Câu lệnh  39: Cảnh nhìn từ trên không của Santorini trong giờ xanh, thể hiện kiến ​​trúc tuyệt đẹp của các tòa nhà Cycladic màu trắng với mái vòm màu xanh lam. Khung cảnh miệng núi lửa thật ngoạn mục và ánh sáng tạo nên bầu không khí tuyệt đẹp, thanh bình.

40

Câu lệnh 40: Độ nghiêng của một công trường xây dựng chứa đầy công nhân, thiết bị và máy móc hạng nặng.

41

Gợi ý  41: Một đám mây khổng lồ cao chót vót có hình người xuất hiện trên trái đất. Người mây bắn tia sét xuống trái đất.

42

Câu lệnh  42: Một chú chó Samoyed và một chú chó Golden Retriever đang vui đùa trong một thành phố đèn neon tương lai vào ban đêm. Ánh đèn neon phát ra từ các tòa nhà gần đó lấp lánh trên bộ lông của chúng.

43

Câu lệnh Sora OpenAi 43: Cầu cạn Glenfinnan là một cây cầu đường sắt lịch sử ở Scotland, Vương quốc Anh, bắc qua tuyến cao nguyên phía tây giữa thị trấn Mallaig và Fort William. Đó là một cảnh tượng tuyệt đẹp khi một đoàn tàu hơi nước rời khỏi cây cầu, đi qua cầu cạn có mái vòm. Cảnh quan điểm xuyết những cây xanh tươi tốt và những ngọn núi đá, tạo nên khung cảnh đẹp như tranh vẽ cho chuyến hành trình bằng tàu hỏa. Bầu trời trong xanh và mặt trời chiếu sáng, tạo nên một ngày đẹp trời để khám phá địa điểm hùng vĩ này.

Tất nhiên, Sora không hoàn hảo và vẫn còn những điểm yếu.

OpenAI thừa nhận rằng Sora có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của các cảnh phức tạp và có thể không hiểu các trường hợp cụ thể về nguyên nhân và kết quả . Ví dụ, một người có thể cắn một miếng bánh quy, nhưng sau đó, có thể không có vết cắn nào trên bánh quy.

Sora cũng có thể nhầm lẫn các chi tiết không gian của tín hiệu , chẳng hạn như nhầm lẫn giữa trái và phải và có thể gặp khó khăn khi mô tả chính xác các sự kiện theo thời gian, chẳng hạn như đi theo một quỹ đạo camera cụ thể.

OpenAI hào phóng tung ra 5 video chưa hoàn hảo của mình do Sora tạo ra.

01

Gợi ý  1: Cảnh in bước người đang chạy, phim điện ảnh quay 35mm

Điểm yếu chưa hoàn hảo: Sora đôi khi tạo ra những chuyển động không thể tin được.

02

Gợi ý  2: Năm con sói xám nô đùa rượt đuổi nhau quanh một con đường rải sỏi hẻo lánh, xung quanh là cỏ. Lũ chó con chạy nhảy, rượt đuổi nhau, cắn nhau, chơi đùa. Chơi đuổi bắt trên con đường rải sỏi, xung quanh là cỏ. Đàn con đang chạy nhảy, rượt đuổi nhau, cắn nhau và chơi đùa.)

Điểm yếu chưa tốt: Động vật hoặc con người có thể xuất hiện một cách tự nhiên, đặc biệt là trong những cảnh có nhiều thực thể.

03

Câu lệnh  3: Bóng rổ qua vòng rồi phát nổ.

Điểm yếu: Một ví dụ về mô hình vật lý không chính xác và vật thể “biến hình” không tự nhiên.

04

Câu lệnh  4: Các nhà khảo cổ phát hiện ra một chiếc ghế nhựa thông thường trên sa mạc, họ đã khai quật và phủi bụi nó một cách hết sức cẩn thận.

Điểm yếu: Trong ví dụ này, Sora không mô hình hóa chiếc ghế như một vật cứng, dẫn đến các tương tác vật lý không chính xác (Nhược điểm: Trong ví dụ này, Sora không mô hình hóa chiếc ghế như một vật cứng, dẫn đến các tương tác vật lý không chính xác.)

05

Gợi ý  5: Một người bà với mái tóc màu xám được chải gọn gàng đứng sau chiếc bánh sinh nhật đầy màu sắc với nhiều ngọn nến trên bàn ăn bằng gỗ, vẻ mặt là niềm vui và hạnh phúc thuần khiết, với ánh mắt lấp lánh hạnh phúc. Cô cúi người về phía trước và thổi tắt những ngọn nến một cách nhẹ nhàng, chiếc bánh có phủ kem màu hồng và những ngọn nến ngừng lung linh, bà ngoại mặc một chiếc áo cánh màu xanh nhạt có trang trí hoa, vài người bạn và gia đình hạnh phúc ngồi vào bàn. nhìn thấy ăn mừng, mất tập trung. Cảnh quay được quay đẹp, đậm chất điện ảnh, thể hiện góc nhìn 3/4 của bà ngoại và phòng ăn. Tông màu ấm áp và ánh sáng dịu nhẹ giúp nâng cao tâm trạng.

(Một bà già tóc trắng với mái tóc chải gọn gàng đang đứng trước bàn ăn bằng gỗ. Phía sau là một chiếc bánh sinh nhật nhiều màu sắc với vô số ngọn nến trên đó. Đôi mắt bà sáng ngời hạnh phúc, khuôn mặt tràn đầy niềm vui. Tiết lộ Một vẻ mặt vui tươi và hạnh phúc. Cô nghiêng người về phía trước và nhẹ nhàng thổi tắt nến. Trên bánh có phủ kem và rắc màu hồng. Ngọn nến không còn lung linh nữa. Bà nội mặc áo sơ mi màu xanh nhạt. Được trang trí bằng họa tiết hoa, vài người bạn vui vẻ và gia đình có thể được nhìn thấy đang ngồi quanh bàn ăn mừng, làm mờ tiêu điểm. Cảnh này được quay đẹp mắt và giống như trong phim, cho thấy bà ngoại và góc nhìn 3/4 của phòng ăn.)

Điểm yếu chưa tốt: Việc mô phỏng các tương tác phức tạp giữa các đồ vật và nhiều nhân vật thường là thách thức đối với người mẫu, đôi khi dẫn đến nhiều thế hệ hài hước, dẫn đến hài hước.)

Chat GPT 4 Chỉ ra cách-phương pháp mà Sora OpenAi đã sử dụng để tạo ra các Video:

  1. Mô tả cảnh và nhân vật chi tiết: Lời nhắc chứa mô tả chi tiết về cảnh, nhân vật và hành động của nhân vật để có thể tạo nội dung video dựa trên các chi tiết này, làm tăng tính phong phú và hấp dẫn của video.
  2. Tạo cảm xúc và bầu không khí: Thông qua việc lựa chọn và mô tả từ ngữ cụ thể, các từ gợi ý đã tạo thành công cảm xúc và bầu không khí mong muốn, chẳng hạn như “ánh sáng ấm áp”, “bước đi tự tin và giản dị”, v.v., tất cả đều góp phần giúp Video truyền tải sâu sắc hơn những trải nghiệm đầy cảm xúc.
  3. Hướng dẫn về góc nhìn và kỹ thuật quay: Một số từ gợi ý chỉ rõ góc nhìn và kỹ thuật quay, chẳng hạn như “góc máy thấp” và “chế độ xem bằng máy bay không người lái”, giúp hướng dẫn cách thể hiện hình ảnh và phong cách của video.
  4. Tính sáng tạo và trí tưởng tượng : Lời nhắc thể hiện khả năng sáng tạo và trí tưởng tượng phong phú, bao trùm nhiều cảnh khác nhau từ thế giới đời thực đến thế giới giả tưởng, khuyến khích việc tạo ra nội dung trực quan vượt xa những gì thông thường.

Liệu Sora OpenAI giả lập thế giới có thực sự bỏ lại nền văn minh nhân loại?

Vào ngày 15 tháng 2 năm 2024, công ty trí tuệ nhân tạo OpenAI của Mỹ bất ngờ khiến cả thế giới bất ngờ khi mô hình chuyển văn bản thành video Sora của họ cuối cùng cũng thông báo rằng nó đã được phát triển thành công. Không quá lời khi nói rằng Sora là một cột mốc quan trọng khác trong sự phát triển của lĩnh vực AI và mức độ gây sốc của nó không kém gì sự xuất hiện của ChatGPT vào năm 2022.

Trong khi các công cụ video AI như Pika và Runway vẫn đang cố gắng vượt qua sự gắn kết trong vòng vài giây, thì Sora do OpenAI phát triển đã gây ra một đòn giảm kích thước cho các mô hình khác. Nó không chỉ có thể tạo video dài tới 1 phút mà còn đảm bảo độ trung thực của hình ảnh cực cao. Điểm độc đáo của Sora là nó kết hợp mô hình khuếch tán và kiến ​​trúc chuyển đổi để có khả năng tạo video chưa từng có.

Nói một cách đơn giản, giờ đây Sora có thể thực hiện suy luận và một loạt các mở rộng tự động dựa trên các quy luật vật lý của thế giới thực. Khi thời gian trôi qua, có thể dự đoán điều gì sẽ xảy ra tiếp theo trong khung cảnh, các vật thể trong khung cảnh sẽ di chuyển như thế nào, chúng sẽ đi theo quỹ đạo nào và thậm chí cả hình dạng của chúng sẽ thay đổi như thế nào, v.v.

Bạn phải biết rằng hầu hết các công cụ tạo video trước đây đều có chất lượng hình ảnh tương đối trung bình, vượt xa nhu cầu của người dùng và thời gian tạo video cũng rất ngắn. Nhưng bây giờ chỉ cần bạn có thể học Sora, ngay cả khi bạn là người bình thường, ngay cả khi bạn không hiểu gì về công nghệ video, chỉ cần bạn có trí tưởng tượng phong phú và có thể mô tả chính xác hình ảnh, bạn thậm chí có thể tạo ra một bức tranh cao cấp. -phim chất lượng độc lập Movie.

Đúng vậy, Sora ngày nay đã vượt xa một công cụ và giống một công cụ mô phỏng thế giới vật lý hơn. Nó sử dụng khả năng sáng tạo và trí tưởng tượng mạnh mẽ để cho chúng ta thấy một thế giới ảo chứa đầy những khả năng vô hạn. Tiếp theo, chúng ta hãy sử dụng một loạt từ gợi ý để xem Sora mạnh đến mức nào.

Một người phụ nữ sành điệu bước đi trên đường phố Tokyo, nơi tràn ngập ánh đèn neon ấm áp và logo thành phố năng động. Cô mặc áo khoác da màu đen, váy dài màu đỏ, đi bốt đen và mang một chiếc túi da màu đen. Đeo kính râm và tô son đỏ, cô bước đi tự tin và thoải mái. Đường phố ẩm ướt và phản chiếu, tạo ra hiệu ứng gương ánh sáng đầy màu sắc, nhiều người đi bộ lên xuống phố.

Video này là tập hợp lời nhắc đầu tiên xuất hiện khi OpenAI giới thiệu mô hình video Sora trên trang web chính thức của mình. Các chi tiết bối cảnh cũng như sự ăn khớp giữa các nhân vật và hành động gần như hoàn hảo. Nếu tôi không kể cho bạn nghe đoạn video dài 1 phút này, bạn có tin nó được tạo ra bởi AI không?

Ngoài ra, Sora còn vượt xa các mẫu khác về tính linh hoạt lấy mẫu, mở rộng video và ngôn ngữ ống kính. Tuy nhiên, do lo ngại Sora có thể bị lạm dụng, OpenAI hiện không mở cửa cho công chúng và chỉ cấp quyền truy cập hạn chế cho một số ít nhà nghiên cứu để hiểu tác hại tiềm ẩn của mô hình.

Tuy nhiên, OpenAI không hoàn hảo, họ cũng phát hiện ra một số khuyết điểm, ví dụ như mô hình vẫn còn nhiều hạn chế, chưa thể mô phỏng chính xác tính chất vật lý của các tương tác cơ bản. Nhưng còn những khuyết điểm này thì sao? Kể từ khi nền văn minh nhân loại xuất hiện, chúng ta đã vượt qua hết lỗ hổng này đến lỗ hổng khác mà từng được cho là không thể vượt qua. Từ Newton đến Einstein, từ lực hấp dẫn đến thuyết tương đối, từ cơ học cổ điển đến vật lý lượng tử, sau hàng trăm năm phát triển không ngừng, cuộc cách mạng công nghiệp đã thay đổi mọi thứ, và cuối cùng chúng ta đã trở thành chủ nhân của trái đất.

Và giờ đây, sự phát triển bùng nổ của AI sẽ là một bước ngoặt trong nền văn minh nhân loại, nó nhất định sẽ thay đổi hướng đi của thế giới một lần nữa, thậm chí có thể có cơ hội hoàn thành một bước nhảy vọt về mặt văn minh.

Sora có thể tạo ra thế giới mô phỏng, liệu có thể thay thế con người không?

Đối với một số “người ăn dưa” thì đây có thể chỉ là một trò chơi nhỏ tương tự như trò nhập mật khẩu sẽ có kết quả, nhưng đối với những người trong ngành, họ lại tỏ ra “sốc” rõ ràng –

Người ta nói rằng một nhà sản xuất Hollywood đã chọn địa điểm và dự định đầu tư hàng chục triệu để xây dựng xưởng quay để quay một bộ phim hoạt hình mới, khi nhìn thấy hiệu quả của Sora, ông ta lập tức rút vốn đầu tư và quyết định chờ đợi diễn biến tiếp theo của Sora. .—Vì bạn chỉ cần nhập một vài từ khóa trên máy tính để tạo ra những bức ảnh sống động chân thực và thông minh như vậy, tại sao lại bỏ ra nhiều tiền như vậy cho một studio?

Fan Yaowei, giám đốc sáng tạo của F5, một công ty sáng tạo độc lập trong nước và là giám khảo của Liên hoan sáng tạo quốc tế Cannes Lions, người được tờ báo này phỏng vấn độc quyền, cũng cho biết: Các nhà biên kịch Hollywood đã tiến hành một “cuộc tổng đình công” vì sự xuất hiện của ChatGPT vào năm ngoái và phản đối việc sử dụng AI để thay thế công việc của các nhà biên kịch là con người, giờ đây có thể đến lượt đội ngũ quay phim và sản xuất cùng nhau đình công.

Ông tin rằng sự xuất hiện của Sora chắc chắn sẽ có tác động rất lớn đến các ngành văn hóa và thị trường vốn trong và ngoài nước như ngành công nghệ, ngành quảng cáo, ngành điện ảnh và truyền hình, ngành báo chí, đặc biệt là ngành sáng tạo, sẽ mang lại một “cuộc cách mạng khoa học”. cuộc cách mạng”.

Bước tiến đột phá của Vincent Video – hình ảnh mượt mà và độ trung thực cao hơn

Sora thực chất chỉ là công cụ video Vincent đầu tiên của OpenAI. Trước đó, nhiều công ty đã tung ra các mô hình ban đầu cho video Vincent.

Ví dụ, vào tháng 11 năm ngoái, công ty Meta của Mỹ, công ty điều hành trang mạng xã hội Facebook, đã phát hành mô hình tạo video Emu Video; sau đó, công ty khởi nghiệp trí tuệ nhân tạo Stability.ai của Mỹ cũng phát hành mô hình tạo video nguồn mở Stable Video Diffusion. (SVĐ). Tuy nhiên, những mô hình này chỉ tạo ra hình ảnh động thông qua việc nhập văn bản đơn giản.

Ngay sau đó, vào ngày 18 tháng 11 năm ngoái, ByteDance, công ty sở hữu các sản phẩm thương hiệu nổi tiếng như Douyin và Toutiao, đã ra mắt mô hình video Vincent PixelDance; Alibaba theo sát và cho ra mắt mô hình Animate Who; các mô hình này có khả năng tạo ra phong phú và năng động hơn video đã bắt đầu.

Công cụ video Wensheng “Dujia Clip” do Baidu phát hành được cho là có thể thu được các điểm nóng mới nhất chỉ bằng một cú nhấp chuột, cho phép AI tạo bản sao chép và sau đó tạo video chỉ bằng một cú nhấp chuột.

Có thể nói, cuối năm ngoái đầu năm nay là giai đoạn bùng nổ của mô hình Vincent Video AI.

Lý do chính khiến tin tức về phiên bản beta nội bộ của Sora gây sốc cho mọi tầng lớp là vì tác dụng của nó quá đáng kinh ngạc. Nó không chỉ có thể tạo ra những video có độ trung thực cao dài tới 1 phút mà hiệu ứng còn rất chân thực và hình ảnh mượt mà. Không có gì ngạc nhiên khi bài nghiên cứu của Sora được công bố trên trang web chính thức của Open AI thậm chí còn tuyên bố rằng Sora là một “trình giả lập thế giới”.

Nếu các video do các mô hình trước đó tạo ra được coi là “sự kết hợp trôi chảy” của nhiều hình ảnh thực thì bước đột phá đáng kinh ngạc nhất của Sora là tính nhất quán và mạch lạc, nó thực sự hiện thực hóa khả năng hiểu và mô phỏng thế giới thực của AI.

Sáng tạo tự do hơn – hiểu “lời mọi người” và sử dụng “trí tưởng tượng” của bạn

Nhìn kỹ hơn vào quá trình Sora tạo video, không khó để nhận ra rằng nó không chỉ là một công cụ sản xuất video mà giống một đối tác sáng tạo toàn diện hơn – có vẻ như chỉ cần bạn có ý tưởng, nó sẽ có thể biến nó thành hiện thực. Dựa trên khả năng kép của nó là hiểu thực tế và mô phỏng thế giới thực, điều đó có nghĩa là nó không chỉ có thể hiểu “lời nói của con người” mà còn có thể sử dụng “trí tưởng tượng” của mình để tạo ra.

Bạn có thể cung cấp cho nó một văn bản cụ thể để mô tả một cảnh đời thực và để nó tạo ra cảnh đó hoặc bạn có thể cung cấp cho nó một bức ảnh và để nó tạo một cảnh tương ứng dựa trên hình ảnh đó rồi tạo video. Nó có thể cung cấp cho bạn một số thay đổi chi tiết tại thời điểm của video dựa trên dữ liệu lớn mà nó có và cũng có thể suy ra các cảnh tương ứng tiến hoặc lùi, mở rộng và mở rộng không gian tưởng tượng mà bạn cung cấp – điều này giúp mở rộng đáng kể khả năng sáng tạo của bạn cũng cải thiện đáng kể hiệu quả công việc.

Có thể thấy rằng Sora lẽ ra đã có khả năng định hình lại hiểu biết của chúng ta về “trợ lý thông minh” chứ không chỉ trả lời những câu hỏi đơn giản như “Ngày mai thời tiết sẽ như thế nào?”

Chúng ta cũng có thể tưởng tượng những thay đổi khoa học hoặc thay đổi ngành mà Sora sẽ mang lại. Dù bạn muốn làm gì với Sora thì định mệnh sẽ khơi dậy một “cuộc cách mạng” trong cuộc đời chúng ta. Ít nhất, việc sản xuất các video ngắn sẽ trở nên dễ dàng hơn và có nhiều cơ hội hơn.

Được biết, hiện tại ở Trung Quốc, các tổ chức dịch vụ thương mại điện tử đã tung ra dịch vụ “AI tự động viết kịch bản video dựa trên các meme nóng” cho những người dẫn dắt hàng hóa.

Ngoài ra còn có một số bộ phim truyền hình siêu ngắn được sản xuất, không chỉ chân thực đến từng chi tiết mà còn có hiệu ứng đặc biệt, có thể mang lại sự sáng tạo tốt về mặt nội dung, thậm chí cả chủ đề khoa học viễn tưởng. Hơn nữa, không cần phải trả tiền cho diễn viên, còn tiết kiệm chi phí dàn dựng cảnh quay, những ưu điểm này không chỉ nâng cao hiệu quả của thành phẩm mà còn giảm giá thành rất nhiều.

Hãy cảnh giác với việc sử dụng Sora để khiến người khác lo lắng – nó vẫn cần ý tưởng từ “người thuận não phải”

Dù thế nào đi chăng nữa, thời điểm Sora kết thúc quá trình thử nghiệm nội bộ và ra mắt công chúng vẫn là tâm điểm chú ý của giới công nghệ. Mô hình tạo video của các công ty khác cũng đang có những tiến bộ nhanh chóng. Giống như sự xuất hiện của AI và xe tự lái, Sora chắc chắn sẽ kéo theo nỗi lo “máy trạm bị thay thế”.

Trên thực tế, Sora đã gây ra xáo trộn đáng kể trong giới công nghiệp sáng tạo trong nước. Người trong ngành vẫn đang tranh luận sôi nổi: Sau khi hội họa AI trở nên phổ biến, ngành sáng tạo là “khoa học” hay “nghệ thuật”? Bây giờ nó đã được nâng cấp thành “Người hành nghề sáng tạo nên đi đâu?”

Những người khác chỉ đơn giản là sử dụng Sora để “bán sự lo lắng”. Chẳng hạn, họ sẽ đặt những sản phẩm công nghệ thời thượng này trước mặt bạn và khoe khoang, rồi nói: “Nhìn này, nếu bạn không biết sử dụng những sản phẩm công nghệ cao này thì bạn sẽ lạc hậu!”. họ bắt đầu bán các khóa học khác nhau hoặc chỉ lấy chúng ra Một số cái gọi là “Sản phẩm hàng đầu AIGC (Nội dung trí tuệ nhân tạo)” có thể chưa hoàn thiện khiến bạn cảm thấy rằng bạn có thể sử dụng những phương pháp đơn giản này để theo kịp tốc độ công nghệ .

Về vấn đề này, Fan Yaowei, người đi đầu trong ngành sáng tạo, cho biết trong một cuộc phỏng vấn rằng những người thực sự cần sử dụng những mô hình này để tạo video chủ yếu là các chuyên gia tham gia vào ngành điện ảnh và sản xuất nội dung video. Người bình thường thì không. có vẻ cần phải lo lắng về điều này.. Công chúng có thể tìm hiểu thông tin cơ bản và trải nghiệm nó bằng một số công cụ Vincent Video và Tusheng Video đơn giản được cung cấp rộng rãi nhưng không cần thiết phải thành thạo các công nghệ này ngay lập tức.

Về việc liệu AI cuối cùng có thay thế khả năng làm việc của con người hay không do sự phát triển nhanh chóng của nó, Fan Yaowei nói rằng nhà tương lai học người Mỹ Daniel Pink từng tin rằng xã hội tương lai sẽ coi trọng sáu khả năng: kể chuyện, thiết kế, hòa nhập, đồng cảm, sức mạnh, cảm giác giải trí. , một ý nghĩa. Nhìn vào sáu thứ này, chúng thực chất là điểm mạnh của não phải của con người, những người sở hữu những khả năng này được gọi là “người thuận não phải”.

Hiện tại, mô hình Sora có thể tạo ra một video dài một phút từ một đoạn văn bản do con người cung cấp. Video thậm chí có thể trình bày nhiều nhân vật, các kiểu chuyển động cụ thể, chủ đề chính xác và chi tiết nền phức tạp, nhưng rõ ràng là nó vẫn cần ” Những người thuận não phải” với não phải phát triển (tức là sáng tạo, giàu trí tưởng tượng, có thể kể những câu chuyện hay và viết những bài văn hay) sẽ cung cấp những văn bản sáng tạo.

Ông đề cập rằng công nghệ hoặc sản phẩm thực sự tốt được sử dụng để giải quyết vấn đề hơn là tạo ra chúng. Vì vậy, trước khi Sora chính thức mở cửa, chúng ta có thể giữ bình tĩnh và lý trí – triết gia vị lợi Peter Singer tin rằng tính đúng đắn của hành động phụ thuộc vào việc chúng có giúp tối đa hóa hạnh phúc hay khoái cảm và giảm thiểu nỗi đau hay không. Ông nhấn mạnh rằng các nhà phát triển công nghệ cũng nên xem xét lợi ích của tất cả các cá nhân bị ảnh hưởng khi xem xét hậu quả hành động của họ.

Trên thực tế, Sora cũng giống như nhiều sản phẩm công nghệ cao không hoàn hảo hiện nay, vẫn còn rất nhiều vấn đề cần được con người giải quyết.

Ví dụ, trong video thường có những cảnh đi ngược lại lẽ thường như bướm bay trên biển, áo nam chính “sát” vào da, nữ chính có thêm một tay hoặc bàn tay và cơ thể không ở trong. cùng một kích thước không gian và tốc độ.Đối với ô tô đi trên đất cát, chỉ có bánh sau sẽ có bụi, còn bánh trước thì không.Những vấn đề như thế này vẫn chưa được giải quyết thỏa đáng. Vì vậy, một số người cho rằng nếu AI được phép tiếp tục “xây dựng thế giới”, khả năng chúng ta cần nhất có thể không phải là học hỏi mà là phân biệt tính xác thực với sự giả dối.

Trước thềm chờ đợi sự ra mắt thực sự của Sora, chúng ta thực sự nên duy trì lối suy nghĩ phản biện, cũng như duy trì sự tò mò và khoan dung. Sớm muộn gì bạn cũng sẽ thấy Sora chỉ là một bước nhỏ trong sự phát triển của công nghệ, mọi sự phát triển của công nghệ đều giống như một cuộc phiêu lưu.

Sự tác động và ảnh hưởng của SORA đối với con người sẽ lớn như thế nào?

OpenAI tại Hoa Kỳ đã ra mắt mô hình video tạo văn bản mới-SORA, với thời gian xuất ra lên tới 60 giây! Hiệu ứng thật sốc và đáng kinh ngạc!

Đây không chỉ là sự hiểu biết sâu sắc về các quy luật vận động của thế giới vật chất mà còn là sự nắm bắt chính xác cách trình bày các chủ đề phức tạp và cảm xúc của văn bản.

Có thể nói ước mơ ném vào một cuốn tiểu thuyết và nhanh chóng trình làng một bộ phim bom tấn liệu có thực sự sắp trở thành hiện thực?

Màn hình công nghệ mạnh mẽ này khiến người ta nhớ đến hàng loạt đột phá công nghệ do các kỹ sư ở Thung lũng Silicon thực hiện trong 20 năm qua.

Với mỗi tiến bộ, chúng tôi cảm thấy ngày càng cấp bách.

Ngay cả ông trùm công nghệ ở Trung Quốc cũng đăng ba video liên tiếp bình luận về vấn đề này, nhấn mạnh rằng cạnh tranh công nghệ cuối cùng phụ thuộc vào mật độ nhân tài và sự tích lũy sâu sắc.

Ông tin rằng OpenAI chắc chắn vẫn còn giấu trong tay một số vũ khí bí mật và khoảng cách AI giữa hai nước lớn có thể tiếp tục gia tăng.

Việc hiện thực hóa trí tuệ nhân tạo nói chung A không còn là vấn đề 10 hay 20 năm nữa mà là hiện thực có thể đến nhanh chóng sau một hoặc hai năm!

Nói đến đây phải kể đến dự thảo đào tạo ngoài trường được ban hành trước Tết.

Ngành giáo dục và đào tạo sắp mở cửa trở lại?

Trước sự phát triển nhanh chóng của AI, đã đến lúc phải xem xét lại nỗi lo lắng về con đường tiến hóa?

Xét cho cùng, cạnh tranh trong tương lai không chỉ là cạnh tranh về kiến ​​thức mà còn là cạnh tranh về sự đổi mới và khả năng thích ứng.

Và bạn biết những gì? Sora không chỉ là trò chơi dành cho những ông lớn đó mà còn là cơ hội cho những người bình thường chúng ta!

“Nhưng tôi chỉ là một người bình thường. Làm sao tôi có thể tìm được cơ hội trong làn sóng kinh tế?” Bạn có thể hỏi.

Đúng vậy, trước đây chúng ta luôn cho rằng nền kinh tế là chiến trường của giới thượng lưu mặc vest, cà vạt, còn người dân bình thường chỉ có thể đứng nhìn từ xa.

Nhưng Sora đã thay đổi mọi thứ! Nó giống như một dòng nước trong vắt vượt qua ngưỡng cửa tưởng chừng như không thể đạt tới, mang đến cho mỗi người cơ hội bắt được con cá của riêng mình trên biển kinh tế.

Đừng tin? Hãy nhìn vào dữ liệu! Mới năm ngoái, một chàng trai trẻ tên Xiao Li, thông qua nền tảng của Sora, đã từ một người mới bắt đầu không có nền tảng trở thành một người mới nổi với thu nhập hàng chục triệu hàng năm, và Sora chính là bàn đạp cho sự thành công của anh ấy.

Bạn có thể nói, “Đây chỉ là một ví dụ.”

Nhưng bạn biết gì không? Trên nền tảng của Sora, những câu chuyện như của Xiao Li đang diễn ra hàng ngày.

Hãy nhớ rằng, làn sóng kinh tế sẽ không dừng lại vì sự do dự của bạn, chỉ những người dám đương đầu với thử thách mới có thể trở thành người chiến thắng thực sự.

Những gì bạn nghe là những trường hợp, những gì bạn học là những ý tưởng, hãy theo dõi tôi, nhấp vào góc dưới bên trái để nhận những thông tin hữu ích và trực tiếp nhận được những thông tin chính sách mới nhất, những xu hướng mới nhất của ngành và những cơ hội đổi mới tiên tiến mỗi ngày, giúp bạn có thể vượt qua hoàn cảnh một cách nhanh chóng và giúp bạn đạt được kết quả nhanh hơn và chính xác hơn. Hãy nắm bắt cơ hội vào năm 2024 và xoay chuyển tình thế nhanh hơn những người khác.

OpenAI Sora là gì?

Đầu tiên chúng ta cần hiểu OpenAi Sora là gì. Sora là mô hình video trí tuệ nhân tạo cỡ lớn do OpenAI phát hành, được phát hành chính thức vào ngày 16 tháng 2 năm 2024 (giờ Bắc Kinh). Công cụ này có thể tự động tạo video thực tế có thời lượng lên tới 60 giây dựa trên lời nhắc văn bản đầu vào.