Tải ảnh sản phẩm Amazon: Hướng dẫn kỹ thuật cho người bán
Nếu bạn từng thử nhấp chuột phải vào một ảnh sản phẩm Amazon và nhận về một tệp JPG 500 pixel với tên kiểu 71xKf-mdsTL._AC_SL500_.jpg, thì bạn đã gặp đúng vấn đề rồi. Pipeline xử lý ảnh của Amazon được thiết kế để gửi đi các bản phái sinh đã định kích thước và đã cache sẵn — không bao giờ là ảnh gốc — và carousel thì giấu bộ biến thể bên trong một khối JSON mà hầu hết mọi người chẳng bao giờ ngó tới.
Hướng dẫn này là tài liệu tham khảo kỹ thuật mà tôi ước gì đã có khi lần đầu cố dựng một quy trình nghiên cứu đối thủ trên Amazon. Chúng ta sẽ giải mã ngữ pháp URL của CDN ảnh, đi qua bốn phương pháp tải thực tế (kèm những đánh đổi mà chẳng ai nhắc đến), rồi biến mớ dữ liệu đó thành thứ hữu ích: một khung kiểm toán hình ảnh tập trung vào CTR mà bạn có thể áp dụng cho 20 listing hàng đầu trong ngành hàng của mình.
Pipeline xử lý ảnh của Amazon thực sự hoạt động ra sao
Amazon không lưu một tệp cho mỗi hình ảnh. Mỗi ảnh sản phẩm được tải lên sẽ được xử lý một lần lúc nạp vào, sau đó được phục vụ theo yêu cầu thông qua một dịch vụ xử lý ảnh có khả năng cắt, thay đổi kích thước, nén lại và đóng dấu mờ ngay tức thì. Bản thân URL chính là lệnh gọi API.
Có ba điều hữu ích cần biết trước khi bạn thử tải bất cứ thứ gì:
- Ảnh gốc luôn có thể truy cập được nếu bạn loại bỏ các cờ kích thước khỏi URL. CDN giữ lại tài nguyên nguồn; URL chỉ cho bộ kết xuất biết cần tạo ra bản phái sinh nào.
- Không có một thư viện ảnh duy nhất nào trong DOM. Carousel hiển thị chỉ kết xuất biến thể đang được chọn tại thời điểm đó. Toàn bộ bộ ảnh nằm trong một đối tượng JavaScript tên là
colorImages(hoặcinitial.colorImages.initialở một số template) — một hash mà mỗi khóa là một ASIN biến thể và giá trị là một mảng các đối tượng ảnh với các trườnghiRes,large,thumbvàmainUrl. - Nội dung A+ dùng một host riêng và một vùng DOM riêng. Nó không thuộc về
colorImages. Bạn phải quét#aplus_feature_div(hoặcaplus3p_feature_divtương đương cho các thương hiệu vendor) và lấy các thẻ<img>từ đó ra.
Hầu hết các hướng dẫn “tải ảnh amazon” mà bạn tìm thấy trên mạng đều dừng lại ở carousel. Một nửa số tài nguyên trên trang không bao giờ được lấy về. Đó chính là khoảng cách giữa một tiện ích lấy được cho bạn 5 ảnh và một tiện ích lấy được 38 ảnh.
Ngữ pháp URL ảnh của Amazon
URL ảnh là thứ hữu ích nhất mà bạn có thể học cách đọc. Nó trông hỗn loạn; thực ra nó là một DSL nhỏ. Lấy một ví dụ thực tế:
https://m.media-amazon.com/images/I/71xKfQk-mdsL._AC_SL1500_.jpg
Có bốn phần đáng chú ý:
| Đoạn | Ý nghĩa |
|---|---|
m.media-amazon.com/images/I/ |
Host ảnh toàn cầu hiện tại. (Các listing cũ hơn vẫn dùng images-na.ssl-images-amazon.com — cả hai đều hoạt động.) |
71xKfQk-mdsL |
ID tài nguyên. Đây là phần duy nhất gắn với hình ảnh cụ thể. |
._AC_SL1500_ |
Khối xử lý. Mỗi cờ được phân tách bằng dấu chấm. |
.jpg |
Định dạng đầu ra. Có thể thay bằng .png hoặc .webp trên hầu hết tài nguyên. |
Để lấy ảnh gốc, bạn giữ lại ID tài nguyên và bỏ đi khối xử lý:
https://m.media-amazon.com/images/I/71xKfQk-mdsL.jpg
URL đó trả về tệp nguồn đã tải lên, mà với các listing Amazon hiện tại thường là 1500–2560 px ở cạnh dài nhất, đôi khi hơn 5000 px đối với các module A+ Premium và các khung hình ảnh xoay 360°.
Giải mã từng cờ xử lý
Dưới đây là danh sách các cờ đang dùng được. Bạn hiếm khi cần tới tất cả, nhưng hiểu chúng sẽ khiến lần sau Amazon thay đổi hành vi CDN trở thành chuyện chẳng đáng bận tâm.
| Cờ | Tác dụng |
|---|---|
_AC_ |
“Amazon Common” — ngữ cảnh kết xuất chuẩn. Thường có mặt nhưng không bắt buộc tuyệt đối. |
_SL1500_ |
Scale cạnh dài nhất (Scale Longest) về 1500 px. Đổi con số để điều chỉnh kích thước. |
_SX466_ |
Scale về chiều rộng 466 px (chiều cao tự động). |
_SY679_ |
Scale về chiều cao 679 px (chiều rộng tự động). |
_SR300,300_ |
Scale và Resize về khung 300×300, thêm đệm nếu cần. |
_CR0,0,500,500_ |
Crop Rectangle (chữ nhật cắt): x, y, chiều rộng, chiều cao tính bằng pixel của nguồn. |
_QL80_ |
Quality Level (mức chất lượng) 80 (chất lượng JPEG). Mặc định khoảng 70. |
_FMjpg_ |
Buộc định dạng đầu ra về JPEG (cũng có _FMpng_, _FMwebp_). |
_PIfont,TopLeft,... |
Lớp phủ ảnh lập trình (Programmatic Image) — dùng cho huy hiệu “Best Seller” hoặc “Limited Time”. |
_US40_ |
Sprite góc trên trái (Upper-left Sprite) — dùng nội bộ, thường an toàn để bỏ. |
_RI_ |
Cờ kết xuất ảnh (Render Image), thường không có tác dụng gì với bản phái sinh. |
Thứ tự rất quan trọng. Các cờ được đọc từ trái sang phải và nối tiếp nhau, nên ._SX300_AA300_QL80_ thay đổi kích thước về 300 chiều rộng, sau đó ràng buộc vào khung vuông 300, rồi mã hóa lại ở chất lượng JPEG 80.
“Mẹo” mà nửa Internet khuyên dùng
Bạn sẽ thấy những bài blog nói “chỉ cần đổi _SL500_ thành _SL1500_ để có phiên bản độ phân giải cao”. Cách đó có hiệu quả, nhưng là đường vòng. Nước đi nhanh hơn là loại bỏ toàn bộ khối xử lý. Ảnh gốc luôn ở đó — bạn không phải đoán chiều rộng tối đa.
Hai lưu ý thực tế:
- Một số listing rất cũ lưu ảnh nguồn nhỏ hơn yêu cầu hiện đại. Nếu bạn bỏ cờ và nhận về một ảnh 1000 px, thì đó chính là ảnh gốc.
- Chip biến thể (
_SS40_) là những hình thu nhỏ được cố tình làm nhỏ. Bỏ cờ sẽ trả về một ảnh 200–300 px, không phải ảnh độ phân giải cao. Chip thuộc một lớp tài nguyên khác.
Mỗi loại ảnh nằm ở đâu
Các hậu tố trong tên tệp của Amazon là một hệ thống phân loại, không phải sự trùng hợp. Khi bạn lấy một bản tải đã được sắp xếp, bạn sẽ thấy các mã như MAIN, PT01, SWATCH — chúng ứng với vị trí mà hình ảnh đó lấp vào.
| Mã | Vị trí | Người bán dùng nó để làm gì |
|---|---|---|
MAIN |
Ảnh chủ đạo — chỉ một ảnh cho mỗi listing. Nền trắng tinh, sản phẩm chiếm ≥85% khung hình, không cho phép chữ hay huy hiệu. | Đòn bẩy CTR lớn nhất. Quy tắc tỷ lệ khung hình được thực thi. |
PT01–PT08 |
8 vị trí phụ. Không hạn chế nền. | Lifestyle, infographic, sơ đồ kích thước, chi tiết thành phần, trước/sau. |
SWATCH |
Hình thu nhỏ của bộ chọn biến thể (màu, họa tiết, lớp hoàn thiện). | Những chip nhỏ bên cạnh bộ chọn biến thể. |
APLUS_* |
Các module Nội dung A+ bên dưới các gạch đầu dòng. | Câu chuyện thương hiệu, bảng so sánh, các bảng kiểu banner. |
APLUS_PREMIUM_* |
A+ Premium (chỉ với Brand Registry): ảnh chủ đạo rộng 1464 px, carousel video, ảnh có điểm tương tác. | Kể chuyện thương hiệu với độ chân thực cao hơn. Rất ít ngành hàng tận dụng tốt — thường là một nước đi tạo khác biệt dễ dàng đạt được. |
IN01–IN08 |
Ảnh thay thế “in-context”, hiển thị trong các bản xem trước bên cạnh kết quả tìm kiếm trên một số marketplace. | Bối cảnh lifestyle mà Amazon có thể chọn để hiển thị trong tìm kiếm. |
REVIEW_* |
Ảnh đánh giá do khách hàng tải lên. Thuộc sở hữu của người viết đánh giá. | Ảnh sản phẩm trong điều kiện thực tế, ảnh đóng gói, tài liệu về lỗi. |
Khi bạn nghiên cứu một đối thủ, sự phân bổ trên các vị trí này tiết lộ chiến lược của họ. Một listing dùng MAIN + PT01–PT07 + APLUS_PREMIUM đang đầu tư tiền thật vào chuyển đổi. Một listing với MAIN + 3 vị trí PT và không có A+ đang bỏ lỡ CTR.
Phương pháp 1: Tiện ích Chrome (lựa chọn thực tế mặc định)
Một tiện ích được tạo ra cho đúng mục đích này sẽ phân tích JSON colorImages, đi qua vùng DOM của A+, dựng URL trần cho mỗi tài nguyên và đóng gói tất cả vào một tệp ZIP với các thư mục theo biến thể. Đó là toàn bộ công việc. Lý do đây là lựa chọn mặc định cho hầu hết người bán không phải vì năng lực — mọi phương pháp bên dưới về mặt kỹ thuật đều có thể lấy được một ảnh độ phân giải cao — mà là vì thông lượng. Một listing 12 biến thể với Nội dung A+ đầy đủ và 6 video đánh giá là một thao tác hơn 90 tài nguyên. Làm việc đó từng URL một thì không phải là một quy trình.
Cách dùng ASINCrate
- Cài đặt ASINCrate từ Chrome Web Store. Cũng hoạt động trên Edge, Brave và Arc.
- Mở bất kỳ trang sản phẩm Amazon nào trên hơn 15 marketplace được hỗ trợ (Mỹ, Anh, Đức, Nhật Bản, Ấn Độ, Pháp, Ý, Tây Ban Nha, Canada, Úc, Mexico, Brazil, Hà Lan, Thụy Điển, UAE, Singapore, Thổ Nhĩ Kỳ, Ba Lan).
- Nhấp Tải ZIP. Tiện ích lấy MAIN, toàn bộ
PT*, bộ ảnh đầy đủ của mọi biến thể, tất cả hình thu nhỏ SWATCH, mọi ảnh Nội dung A+ và media đánh giá của khách hàng. Các tệp được đưa vào những thư mục đặt tên theo biến thể; tên tệp bao gồm ASIN và mã vị trí. - Tùy chọn xuất một tệp CSV với các cột cho ASIN, biến thể, vị trí, URL độ phân giải cao, kích thước. Đây là định dạng đầu vào bạn muốn có nếu đang chạy kiểm toán trên hơn 20 listing.
Những thứ bạn không có được khi nhấp chuột phải: tổ chức theo biến thể, mã vị trí được nhúng trong tên tệp, Nội dung A+, media đánh giá, và một tệp kê khai mà bạn có thể pivot trong bảng tính.
So sánh thẳng thắn các tiện ích khác
- AMZ Downloader — Xuất ảnh miễn phí; video và CSV nằm sau gói 6,99 $/tháng. Không phân tích
colorImagesđể lấy biến thể ẩn trên mọi template. - SellerSprite AmzSave — Yêu cầu đăng nhập tài khoản SellerSprite. Chỉ ảnh, không tách riêng Nội dung A+.
- EcomStal — Miễn phí 100%, phủ marketplace rộng, nhưng không xuất CSV và không có cấu trúc thư mục theo biến thể.
- ASINCrate — ZIP với thư mục theo biến thể, tệp kê khai CSV, Nội dung A+ + media đánh giá, tải video HLS , không cần tài khoản cho các lượt tải đơn lẻ.
Nếu thứ duy nhất bạn cần là “lấy ảnh chính một lần”, thì bất kỳ tiện ích nào trong số này (hoặc nhấp chuột phải trên URL không có tham số kích thước) đều ổn. Nếu bạn làm kiểm toán ngành hàng hàng tuần, sự khác biệt được tính bằng hàng giờ mỗi phiên.
Phương pháp 2: Lưu bằng nhấp chuột phải (vì sao gần như không bao giờ hiệu quả với người bán)
Bạn có thể nhấp chuột phải vào bất kỳ hình ảnh đang hiển thị nào và chọn “Lưu ảnh thành”. Bạn sẽ nhận được bản phái sinh đã kết xuất, không phải ảnh gốc — thường là _SL500_ hoặc _AC_SL679_, tùy theo kích thước cửa sổ xem. Tên tệp sẽ trông như 41ABC123._SL500_.jpg, không có ASIN và không có ngữ cảnh vị trí.
Ngay cả với mẹo URL (mở trong tab mới, bỏ cờ kích thước, lưu), bạn cũng chỉ lấy được biến thể đang hiển thị tại thời điểm đó. 11 biến thể còn lại không bao giờ được nạp vào DOM trừ khi bạn nhấp vào chúng. Đây là lý do lớn nhất khiến nhấp chuột phải thất bại với nghiên cứu nghiêm túc: trang giấu đi khoảng 80% số tài nguyên.
Dùng nó cho: lấy một ảnh làm tham khảo nhanh. Bỏ qua nó cho: bất cứ việc gì có tính hệ thống.
Phương pháp 3: Web scraping (khi bạn xử lý hơn 1000 ASIN)
Với các quy trình của đội ngũ dữ liệu đẩy hàng nghìn ASIN vào một cơ sở dữ liệu, hạ tầng scraping chuyên dụng là hợp lý:
- Crawlbase / ScraperAPI / Bright Data — Cung cấp proxy dân cư hoặc trung tâm dữ liệu xoay vòng và giải CAPTCHA. Bạn viết parser; họ lo lớp request. Hãy dự trù khoảng 0,001–0,005 $ mỗi request ở quy mô lớn, cộng thêm thời gian kỹ thuật để duy trì các selector khi HTML của Amazon thay đổi.
- API Keepa / Helium 10 — Các API dữ liệu sản phẩm ở mức cao hơn. URL ảnh là một phần của phản hồi. Rẻ hơn tính theo ASIN nhưng độ chân thực thấp hơn (thường chỉ ảnh chính, đôi khi tối đa 7 ảnh phụ).
- ImportFromWeb — Một công thức Google Sheets kéo HTML của Amazon vào một ô. Cho bạn URL để sao chép-dán; không phải tải tệp thực sự.
Đây là những lựa chọn hạ tầng cho một đội ngũ kỹ thuật dữ liệu, không phải một quy trình cho người bán cá nhân. Đánh đổi là có thật: bạn được quy mô, đánh đổi độ chân thực của Nội dung A+ và gánh thêm gánh nặng bảo trì mỗi khi Amazon cập nhật template của trang.
Phương pháp 4: Mẹo URL bằng DevTools
Phương pháp “miễn phí” cho người dùng kỹ thuật:
- Mở listing, nhấn
F12, vào tab Network và lọc theomedia-amazon. - Nhấp qua từng biến thể và xem cả 7 ảnh sản phẩm. Mỗi request được ghi lại.
- Với bất kỳ URL ảnh nào đã được ghi lại, sao chép nó, bỏ khối xử lý (mọi thứ giữa ID tài nguyên và phần mở rộng tệp), rồi dán URL đã làm sạch vào một tab mới. Lưu lại.
- Để lấy Nội dung A+, cuộn trang để kích hoạt các ảnh nạp trễ, sau đó lọc lại Network theo
aplus.
Cách này hiệu quả. Nó cũng là một bài tập kéo dài 30 phút mỗi listing. Đáng để biết kỹ thuật này vì nó cho bạn thấy một tiện ích thực sự làm gì bên dưới nắp capô; nhưng không đáng làm bằng tay với bất kỳ khối lượng nào trên 1–2 ASIN.
So sánh các phương pháp
| Tiêu chí | Tiện ích Chrome | Nhấp chuột phải | Web scraping | Mẹo DevTools |
|---|---|---|---|---|
| Trả về độ phân giải gốc | Có | Không (bản phái sinh đã kết xuất) | Tùy parser | Có |
| Mọi biến thể trong một lượt | Có (phân tích colorImages) | Chỉ biến thể hiện tại | Tùy trường hợp | Nhấp thủ công từng cái |
| Lấy được Nội dung A+ | Có | Thủ công | Hiếm | Có thể |
| Thời gian mỗi listing | ~5 giây | 5–20 phút | ~1 giây ở quy mô lớn | 15–30 phút |
| Chi phí thiết lập | Cài một lần | Không có | Kỹ thuật | Không có |
| Phù hợp nhất với | Người bán, agency, nhà thiết kế | Nghiệp dư, dùng một lần | Đội ngũ dữ liệu, hơn 1000 ASIN | Tò mò, học hỏi |
Thực sự nên làm gì với các hình ảnh
Hầu hết các bài viết về tải ảnh amazon đều dừng tại đây. Phần việc thú vị bắt đầu sau khi bạn đã có các tệp. Dưới đây là quy trình kiểm toán mà các agency Amazon tốt hơn áp dụng cho một tài khoản khách hàng mới.
Bước 1: Xây dựng một thư viện ảnh ngành hàng (một buổi chiều)
Chọn 20 listing hàng đầu trong ngành hàng của bạn. Lấy toàn bộ ảnh của cả 20 cùng một tệp kê khai CSV. Bạn sẽ có vào khoảng 800–1500 tệp ảnh. Sắp xếp CSV theo vị trí, rồi theo đối thủ.
Bước 2: Kiểm toán ảnh chính
Mở 20 ảnh chính cạnh nhau trong chế độ xem bảng liên hệ (contact sheet). Để ý năm điều:
- Mức lấp đầy khung hình. Quy tắc của Amazon là ≥85%. Một số lượng đáng ngạc nhiên đối thủ chỉ ở mức 60–70%. Của bạn nên ở mức 85–95%, không lề.
- Góc chụp. Hầu hết ngành hàng hội tụ về một góc (chính diện nâng nhẹ 15° cho dụng cụ nhà bếp, chính diện thật cho quần áo, ba phần tư cho đồ điện tử). Những ngoại lệ hoặc là những kẻ dẫn đầu ngành hàng có thể phớt lờ quy ước, hoặc là những kẻ tụt hậu không biết tới nó.
- Màu sắc và độ tương phản. Sắp xếp theo màu chủ đạo. Nếu 18 trên 20 listing trông giống hệt nhau về mặt thị giác, thì nước đi tạo khác biệt là phá vỡ khuôn mẫu.
- Bao bì so với chỉ sản phẩm. Đây là một sự phân hóa thực sự. Các ngành hàng thuê bao/tiêu hao (thực phẩm bổ sung, đồ ăn) thường cho thấy bao bì; hàng bền hiếm khi vậy. Bám theo khuôn mẫu chủ đạo trừ khi bạn có lý do cụ thể để đi ngược lại.
- Gợi ý ngầm về kích thước. Cầm tay, đặt trên bàn, để trên kệ — ảnh chính có truyền tải được kích thước không? Trong các ngành hàng thường xuyên bị trả hàng vì “nhỏ hơn mong đợi”, điều này rất quan trọng.
Bước 3: Dò ngược chiến lược các vị trí PT
Dựng một lưới 8×20: PT01–PT08 ở hàng trên cùng, 20 ASIN ở cột bên. Đánh dấu mỗi ô với loại ảnh (lifestyle / infographic / sơ đồ kích thước / thành phần / trước-sau / so sánh kích cỡ / bao bì / hình thu nhỏ video). Các khuôn mẫu hiện ra trong 30 giây:
- Nếu 18 trên 20 listing có một infographic ở PT01, thì đó là quy ước. Bỏ qua nó là bạn đánh mất khoảnh khắc “đây là cái gì”.
- Nếu chỉ 3 trên 20 dùng sơ đồ kích thước và ngành hàng của bạn thường xuyên có phàn nàn về kích cỡ trong đánh giá, thì đó là lợi thế bất công của bạn.
- Nếu một vị trí PT liên tục bị bỏ trống trong toàn ngành hàng, hãy lấp nó. Amazon sẽ làm nó nổi bật trong tìm kiếm; các đối thủ đang để lại vị trí đó cho bạn.
Bước 4: Chấm điểm Nội dung A+
Nội dung A+ bị tận dụng dưới mức rất nhiều. Trong hầu hết các ngành hàng, ít hơn một nửa trong số 20 listing hàng đầu có một module A+ đáng giá — và trong số đó, hầu hết dùng template mặc định với hình ảnh kiểu ngân hàng ảnh. Một module A+ Premium được thiết kế riêng (chỉ có với Brand Registry) là một trong những chiến thắng CTR rẻ nhất còn lại, chính bởi vì rất ít người bán làm tốt.
Câu hỏi kiểm toán: trong số 5 listing hàng đầu, có bao nhiêu cái có Nội dung A+ mang đậm dấu ấn thương hiệu (ảnh chụp tùy chỉnh, bảng so sánh trực diện với đối thủ được nêu tên, câu chuyện thương hiệu, ảnh nhà sáng lập)? Nếu câu trả lời là không có hoặc chỉ một, thì đó là khoảng trống.
Bước 5: Khai thác ảnh đánh giá
Ảnh đánh giá của khách hàng là nguồn phản hồi trung thực về sản phẩm tốt nhất mà bạn từng đọc được. Lấy media đánh giá của 5 đối thủ hàng đầu. Tìm:
- Khuôn mẫu lỗi. Nếu 30% ảnh đánh giá cho thấy cùng một cái kẹp nhựa bị gãy, thì đó là góc kiểm soát chất lượng của bạn.
- Kích thước thực tế. Ảnh của khách hàng gần như luôn để lộ rằng sản phẩm trông nhỏ hơn ngoài đời so với trong ảnh marketing. Nếu đối thủ của bạn chụp quá điệu đà, thì một bức ảnh thể hiện kích thước trung thực chính là yếu tố khác biệt.
- Những cách dùng mà người bán không lường trước. Người viết đánh giá thường chụp các cách dùng sáng tạo. Hãy thêm chúng làm các vị trí PT trong chính listing của bạn.
Những khác biệt giữa các marketplace khiến nhiều người mắc bẫy
Hệ thống ảnh là như nhau trên mọi marketplace, nhưng quy ước và quy tắc thì không.
- Nhật Bản tưởng thưởng cho độ chân thực cao hơn. Các listing hàng đầu ở Nhật Bản luôn dùng ảnh chính hơn 2560 px và mật độ infographic dày đặc. Các bản sao của phương Tây từ listing thương hiệu Nhật Bản thường trông thiếu chăm chút khi đặt cạnh nhau.
- Đức có quy trình rà soát tuân thủ chặt hơn đối với chữ trên ảnh. Những tuyên bố như “Bestseller” hay “100% Tự nhiên” nhúng trong các vị trí PT bị gắn cờ thường xuyên hơn so với ở Mỹ.
- Ấn Độ cho phép lớp phủ tiền tệ và giá trên ảnh PT thoải mái hơn so với Mỹ, nơi mà điều này nhìn chung bị khuyến cáo không nên làm.
- Anh / EU có cùng Điều khoản dịch vụ như Mỹ về dấu mờ (bị cấm trên MAIN) nhưng thực thi kém nhất quán hơn.
- Brand Registry mở khóa A+ Premium, video trong carousel và video Sponsored Brands — một khoảng cách đáng kể giữa listing đã đăng ký thương hiệu và chưa đăng ký ở bất kỳ marketplace nào.
Những cạm bẫy tuân thủ hình ảnh sẽ giết chết listing của bạn
Chính sách ảnh chính của Amazon được thực thi một cách máy móc (bộ phân loại ảnh + rà soát thủ công khi khiếu nại). Danh sách vi phạm thường gặp:
- Ảnh chính có chữ, huy hiệu, dấu mờ hoặc viền. Bị từ chối tự động. Bao gồm huy hiệu “Made in USA”, logo thương hiệu lơ lửng trong khoảng trắng, lớp phủ “Best Seller”.
- Ảnh chính có khuôn mặt người khi sản phẩm không phải quần áo/mỹ phẩm. Thường bị từ chối.
- Ảnh chính có bao bì khi sản phẩm thường không được bán trong hộp (tức là cái hộp không phải là đơn vị bán). Thực thi không nhất quán, nhưng bị gắn cờ trong các cuộc kiểm toán.
- Ảnh chính mà sản phẩm chiếm ít hơn 85% khung hình. Bị phát hiện tự động.
- Ảnh chính không đặt trên nền trắng tinh RGB (255,255,255). Nền trắng ngà hay có bóng đổ đều bị bắt.
- Ảnh PT lifestyle có bàn tay hoặc cảnh ngụ ý tuyên bố y khoa, giảm cân hay “trước/sau” trong các ngành hàng bị quản lý (thực phẩm bổ sung, làm đẹp). Có thể bị ẩn.
Hãy chạy chính các listing của bạn qua cùng một bộ kiểm tra quy tắc trước khi tung ra một bản thiết kế lại. Số lượng listing bị ẩn vì một nhà thiết kế quá nhiệt tình thêm “Top Rated” vào ảnh chính thực sự rất lớn.
Ranh giới pháp lý
Tải về là phần dễ. Ranh giới nằm ở việc bạn làm gì với tệp:
- Tham khảo và phân tích — ổn. Giống như bước vào cửa hàng của đối thủ với một cuốn sổ tay.
- Tái sử dụng trực tiếp trong chính listing của bạn — vi phạm bản quyền. Amazon sẽ xử lý một khiếu nại trong vòng 48 giờ và có thể đình chỉ listing.
- Tác phẩm phái sinh tương tự về cơ bản — cùng bố cục, cùng đạo cụ, cùng góc chụp, cùng cách xử lý màu là đủ để kích hoạt một lệnh gỡ bỏ, ngay cả khi không sao chép giống hệt từng pixel.
- Ảnh đánh giá của khách hàng — thuộc sở hữu của người viết đánh giá, không phải của Amazon và không phải của người bán. Chỉ dùng cho phân tích nội bộ.
Một quy tắc an toàn: bất cứ thứ gì khiến bạn ngượng ngùng khi đưa vào một bộ slide trình bày trước giám đốc thương hiệu của đối thủ thì có lẽ đã ở phía sai của ranh giới.
Câu hỏi thường gặp
Amazon thực sự lưu trữ ảnh sản phẩm ở độ phân giải nào?
Amazon giữ lại tệp gốc đã tải lên, thường là 1500–2560 px ở cạnh dài nhất đối với các listing hiện tại — và lên tới hơn 5000 px đối với các tài nguyên A+ Premium và ảnh xoay 360° mới hơn. Trang chỉ hiển thị các bản phái sinh đã nén (thường là 500–679 px), nên DOM trên trang không bao giờ để lộ ảnh gốc. Bạn phải hoặc yêu cầu trực tiếp URL không có tham số kích thước, hoặc dùng một công cụ tự dựng URL đó cho bạn.
Những tên tệp như 71xKf...AC_SL1500_.jpg thực sự có nghĩa là gì?
Tên tệp có hai phần: ID tài nguyên (các ký tự ngẫu nhiên trước dấu gạch dưới đầu tiên) và một loạt cờ kích thước và xử lý. _SL1500_ nghĩa là scale cạnh dài nhất về 1500 px; _AC_ là ngữ cảnh kết xuất chuẩn; _UX466_ nghĩa là scale về chiều rộng 466. Loại bỏ mọi cờ và khối phía sau sẽ trả về ảnh gốc.
Tôi có thể tải mọi ảnh biến thể mà không phải nhấp vào từng cái không?
Có. Amazon lưu toàn bộ bộ ảnh biến thể bên trong một đối tượng JSON tên là colorImages (hoặc initial.colorImages.initial) được nhúng trong HTML. ASINCrate phân tích trực tiếp đối tượng này, nhờ đó nó lấy được tất cả ảnh biến thể trong một lần tải duy nhất thay vì bắt bạn duyệt qua từng biến thể.
Tôi tải ảnh của các module Nội dung A+ và A+ Premium như thế nào?
Ảnh Nội dung A+ được phục vụ từ một host khác (thường là m.media-amazon.com/images/S/aplus-media hoặc aplus-media-library-service). Chúng không nằm trong JSON của carousel ảnh chính. ASINCrate quét DOM của A+ riêng và đưa các tài nguyên đó vào cùng một tệp ZIP, gắn nhãn APLUS_*.
Tải hàng loạt ảnh sản phẩm Amazon có vi phạm Điều khoản dịch vụ không?
Điều khoản dịch vụ của Amazon cấm hành vi scraping tự động gây tải nặng lên máy chủ của họ ở quy mô lớn. Tải một trang sản phẩm duy nhất trong trình duyệt của chính bạn và lưu lại những hình ảnh mà trang đã gửi cho bạn là một chuyện hoàn toàn khác — đó chính là lưu lượng mạng mà trang vốn đã tạo ra. Rủi ro pháp lý không nằm ở hành vi lưu ảnh; mà ở việc bạn làm gì với tệp đó. Dùng ảnh của đối thủ trong chính listing của bạn là hành vi vi phạm bản quyền mà Amazon sẽ xử lý.
Kết luận
Pipeline xử lý ảnh được thiết kế để phân phối, chứ không phải để tải về — đó là lý do vì sao một nỗ lực nhấp chuột phải kéo dài 5 phút lại cảm giác khó hơn lẽ ra phải có. Một khi bạn hiểu rằng URL là một lệnh gọi API, rằng các biến thể nằm trong một đối tượng JSON, và rằng Nội dung A+ có host riêng của nó, thì toàn bộ chuyện này trở nên máy móc.
Với sự tò mò dùng một lần, mẹo cắt bớt URL là đủ. Với các cuộc kiểm toán cạnh tranh hàng tuần trên hơn 20 listing — đúng trường hợp sử dụng thực tế của người bán — một tiện ích Chrome biết phân tích colorImages, đi qua DOM của A+ và ghi ra một tệp kê khai CSV là quy trình duy nhất có thể mở rộng quy mô.
Cần lấy cả video nữa? Hãy xem hướng dẫn đồng hành của chúng tôi về cách tải video sản phẩm Amazon , bao gồm cách các luồng HLS/m3u8 và các URL có token đã ký thực sự hoạt động.
Bỏ qua việc mày mò URL — lấy mọi hình ảnh chỉ với một cú nhấp
Cài đặt ASINCrate — miễn phí, không cần tài khoản, tải về ảnh gốc độ phân giải cao kèm thư mục theo biến thể và metadata CSV.
Thêm vào Chrome — Miễn phí