Poradnik

Pobieranie zdjęć z Amazona: techniczny przewodnik dla sprzedawców

Autor: ASINCrate Team · · · 16 min czytania

Jeśli kiedykolwiek próbowałeś kliknąć prawym przyciskiem myszy zdjęcie produktu Amazon i otrzymałeś JPG o szerokości 500 pikseli z nazwą w stylu 71xKf-mdsTL._AC_SL500_.jpg, to już zetknąłeś się z tym problemem. Pipeline zdjęć Amazona jest zbudowany tak, by dostarczać wstępnie przeskalowane, wstępnie zbuforowane pochodne — nigdy oryginał — a karuzela ukrywa zestaw wariantów wewnątrz bloku JSON, do którego większość ludzi nigdy nie zagląda.

Ten przewodnik to techniczny punkt odniesienia, którego brakowało mi, gdy po raz pierwszy próbowałem zbudować tryb pracy do analizy konkurencji na Amazonie. Rozszyfrujemy gramatykę URL-i CDN-u zdjęć, przejdziemy przez cztery prawdziwe metody pobierania (z kompromisami, o których nikt nie wspomina), a potem przekujemy ten zrzut w coś użytecznego: nastawiony na CTR framework audytu zdjęć, który możesz uruchomić na 20 najlepszych ofertach w swojej kategorii.

Jak naprawdę działa pipeline zdjęć Amazona

Amazon nie przechowuje jednego pliku na zdjęcie. Każde przesłane zdjęcie produktu jest przetwarzane raz przy wczytaniu, a następnie serwowane na żądanie przez usługę graficzną, która w locie kadruje, skaluje, ponownie kompresuje i nakłada znak wodny. Sam URL jest wywołaniem API.

Trzy rzeczy warto wiedzieć, zanim spróbujesz cokolwiek pobrać:

  1. Oryginał jest zawsze osiągalny, jeśli usuniesz z URL-a flagi rozmiaru. CDN zachowuje zasób źródłowy; URL po prostu mówi silnikowi renderującemu, którą pochodną wyprodukować.
  2. W DOM nie istnieje jedna galeria zdjęć. Widoczna karuzela renderuje tylko aktualnie wybrany wariant. Pełny zestaw znajduje się w obiekcie JavaScript o nazwie colorImages (lub initial.colorImages.initial w niektórych szablonach) — haszu, w którym każdy klucz to ASIN wariantu, a wartość to tablica obiektów zdjęć z polami hiRes, large, thumb i mainUrl.
  3. Treść A+ używa osobnego hosta i osobnego obszaru DOM. Nie jest częścią colorImages. Musisz przeskanować #aplus_feature_div (lub odpowiednik aplus3p_feature_div dla marek vendor) i wyciągnąć stamtąd znaczniki <img>.

Większość przewodników o „pobieraniu zdjęć z amazona”, które znajdziesz w sieci, zatrzymuje się na karuzeli. Połowa zasobów na stronie nigdy nie zostaje pobrana. To różnica między wtyczką, która pobiera Ci 5 zdjęć, a taką, która pobiera 38.

Gramatyka URL-i zdjęć Amazona

URL zdjęcia to najbardziej użyteczna rzecz, której możesz nauczyć się czytać. Wygląda chaotycznie; w rzeczywistości to mały DSL. Weźmy prawdziwy przykład:

https://m.media-amazon.com/images/I/71xKfQk-mdsL._AC_SL1500_.jpg

Ma cztery znaczące części:

Segment Znaczenie
m.media-amazon.com/images/I/ Aktualny globalny host zdjęć. (Starsze oferty wciąż używają images-na.ssl-images-amazon.com — oba działają.)
71xKfQk-mdsL Identyfikator zasobu. To jedyna część powiązana z konkretnym zdjęciem.
._AC_SL1500_ Blok przetwarzania. Każda flaga jest oddzielona kropką.
.jpg Format wyjściowy. W większości zasobów można go zastąpić na .png lub .webp.

Aby uzyskać oryginał, zachowujesz identyfikator zasobu i usuwasz blok przetwarzania:

https://m.media-amazon.com/images/I/71xKfQk-mdsL.jpg

Ten URL zwraca przesłany plik źródłowy, który dla obecnych ofert Amazona ma zwykle 1500–2560 px na dłuższym boku, czasem ponad 5000 px dla modułów A+ Premium i klatek obrotów 360°.

Każda flaga przetwarzania, rozszyfrowana

Poniżej znajduje się działająca lista flag. Rzadko potrzebujesz ich wszystkich, ale ich zrozumienie sprawia, że następna zmiana zachowania CDN-u przez Amazona będzie dla Ciebie nieistotnym wydarzeniem.

Flaga Efekt
_AC_ „Amazon Common” — standardowy kontekst renderowania. Często obecna, ale nie ściśle wymagana.
_SL1500_ Skaluje dłuższy bok (Scale Longest) do 1500 px. Zmień liczbę, aby kontrolować rozmiar.
_SX466_ Skaluje do szerokości 466 px (wysokość automatyczna).
_SY679_ Skaluje do wysokości 679 px (szerokość automatyczna).
_SR300,300_ Skaluje i dopasowuje (Scale and Resize) do ramki 300×300, dodając wypełnienie w razie potrzeby.
_CR0,0,500,500_ Prostokąt kadrowania (Crop Rectangle): x, y, szerokość, wysokość w pikselach źródła.
_QL80_ Poziom jakości (Quality Level) 80 (jakość JPEG). Domyślnie około 70.
_FMjpg_ Wymusza format wyjściowy JPEG (także _FMpng_, _FMwebp_).
_PIfont,TopLeft,... Programowa nakładka na zdjęcie (Programmatic Image) — używana do plakietek „Best Seller” lub „Limited Time”.
_US40_ Sprite w lewym górnym rogu (Upper-left Sprite) — użytek wewnętrzny, zwykle bezpieczny do usunięcia.
_RI_ Flaga renderowania zdjęcia (Render Image), zwykle bez efektu na pochodnych.

Kolejność ma znaczenie. Flagi są czytane od lewej do prawej i łańcuchowane, więc ._SX300_AA300_QL80_ zmienia rozmiar do 300 szerokości, następnie ogranicza do kwadratowej ramki 300, a potem ponownie koduje z jakością JPEG 80.

„Sztuczka”, którą poleca pół Internetu

Zobaczysz wpisy na blogach, które mówią „wystarczy zmienić _SL500_ na _SL1500_, żeby uzyskać wersję w wysokiej rozdzielczości”. To działa, ale to droga okrężna. Szybszy ruch to usunięcie całego bloku przetwarzania. Oryginał jest tam zawsze — nie musisz zgadywać maksymalnej szerokości.

Dwie praktyczne uwagi:

  • Niektóre bardzo stare oferty przechowują zdjęcia źródłowe mniejsze niż współczesny wymóg. Jeśli usuniesz flagi i otrzymasz zdjęcie 1000 px, to jest właśnie oryginał.
  • Próbki wariantów (_SS40_) to celowo małe miniatury. Usunięcie flagi zwraca zdjęcie 200–300 px, a nie w wysokiej rozdzielczości. Próbki to inna klasa zasobu.

Gdzie znajduje się każdy typ zdjęcia

Sufiksy nazw plików Amazona to system katalogowania, a nie przypadek. Gdy pobierzesz uporządkowane materiały, zobaczysz kody takie jak MAIN, PT01, SWATCH — odpowiadają one miejscu, które wypełnia dane zdjęcie.

Kod Miejsce Do czego używają go sprzedawcy
MAIN Zdjęcie główne — tylko jedno na ofertę. Czyste białe tło, produkt wypełnia ≥85% kadru, tekst ani plakietki są niedozwolone. Największa dźwignia CTR. Reguła proporcji kadru jest egzekwowana.
PT01PT08 8 miejsc dodatkowych. Bez ograniczeń tła. Lifestyle, infografiki, schematy wymiarów, detal składników, przed/po.
SWATCH Miniatury selektora wariantów (kolor, wzór, wykończenie). Małe chipy obok selektora wariantów.
APLUS_* Moduły Treści A+ pod punktami wypunktowania. Historia marki, tabele porównawcze, panele typu baner.
APLUS_PREMIUM_* A+ Premium (tylko z Brand Registry): zdjęcie główne o szerokości 1464 px, karuzela wideo, zdjęcia z punktami interaktywnymi. Narracja marki o wyższej jakości. Bardzo niewiele kategorii dobrze to wykorzystuje — często łatwa do zdobycia różnicująca przewaga.
IN01IN08 Zdjęcia alternatywne „in-context”, wyświetlane w bocznych podglądach wyników wyszukiwania na niektórych platformach. Kontekst lifestylowy, który Amazon może wybrać do pokazania w wyszukiwaniu.
REVIEW_* Zdjęcia z recenzji przesłane przez klientów. Własność autora recenzji. Zdjęcia produktu w realnych warunkach, ujęcia opakowania, dokumentacja wad.

Gdy analizujesz konkurenta, rozkład między tymi miejscami zdradza jego strategię. Oferta, która używa MAIN + PT01PT07 + APLUS_PREMIUM, inwestuje realne pieniądze w konwersję. Oferta z MAIN + 3 miejscami PT i bez A+ zostawia CTR na stole.

Metoda 1: wtyczka Chrome (praktyczna opcja domyślna)

Stworzona specjalnie wtyczka analizuje JSON colorImages, przechodzi przez obszar DOM A+, buduje czysty URL dla każdego zasobu i pakuje wszystko do ZIP-a z folderami wariantów. To całe zadanie. Powodem, dla którego jest to opcja domyślna dla większości sprzedawców, nie są możliwości — każda poniższa metoda technicznie potrafi pobrać zdjęcie w wysokiej rozdzielczości — lecz przepustowość. Oferta z 12 wariantami, pełną Treścią A+ i 6 wideo z recenzji to operacja na ponad 90 zasobach. Robienie tego po jednym URL-u to nie jest tryb pracy.

Jak używać ASINCrate

  1. Zainstaluj ASINCrate ze sklepu Chrome Web Store. Działa też w Edge, Brave i Arc.
  2. Otwórz dowolną stronę produktu Amazon na ponad 15 obsługiwanych platformach (US, UK, DE, JP, IN, FR, IT, ES, CA, AU, MX, BR, NL, SE, AE, SG, TR, PL).
  3. Kliknij Pobierz ZIP. Wtyczka pobiera MAIN, wszystkie PT*, pełny zestaw zdjęć każdego wariantu, wszystkie miniatury SWATCH, każde zdjęcie Treści A+ oraz materiały z recenzji klientów. Pliki trafiają do folderów nazwanych według wariantu; nazwy plików zawierają ASIN i kod miejsca.
  4. Opcjonalnie wyeksportuj CSV z kolumnami dla ASIN, wariantu, miejsca, URL-a w wysokiej rozdzielczości i wymiarów. To format wejściowy, którego potrzebujesz, jeśli przeprowadzasz audyt ponad 20 ofert.

Czego nie dostajesz przy kliknięciu prawym przyciskiem: porządkowania według wariantu, kodów miejsc wbudowanych w nazwę pliku, Treści A+, materiałów z recenzji i manifestu, który możesz analizować w arkuszu kalkulacyjnym.

Inne wtyczki, uczciwie porównane

  • AMZ Downloader — Darmowy eksport zdjęć; wideo i CSV za poziomem 6,99 $/mies. Nie analizuje colorImages pod kątem ukrytych wariantów w każdym szablonie.
  • SellerSprite AmzSave — Wymaga zalogowania na konto SellerSprite. Tylko zdjęcia, bez oddzielenia Treści A+.
  • EcomStal — 100% darmowa, szeroki zasięg platform, ale bez eksportu CSV i struktury folderów wariantów.
  • ASINCrate — ZIP z folderami wariantów, manifest CSV, Treść A+ + materiały z recenzji, pobieranie wideo HLS , bez konta dla pojedynczych pobrań.

Jeśli jedyne, czego kiedykolwiek potrzebujesz, to „pobrać raz zdjęcie główne”, każda z nich (lub kliknięcie prawym przyciskiem na URL bez parametru rozmiaru) wystarczy. Jeśli robisz cotygodniowe audyty kategorii, różnica liczona jest w godzinach na sesję.

Metoda 2: zapis prawym przyciskiem (dlaczego prawie nigdy nie działa u sprzedawców)

Możesz kliknąć prawym przyciskiem dowolne widoczne zdjęcie i wybrać „Zapisz obraz jako”. Otrzymasz wyrenderowaną pochodną, a nie oryginał — zwykle _SL500_ lub _AC_SL679_, zależnie od rozmiaru okna. Nazwa pliku będzie wyglądać jak 41ABC123._SL500_.jpg, bez ASIN-u i bez kontekstu miejsca.

Nawet ze sztuczką URL-a (otwórz w nowej karcie, usuń flagę rozmiaru, zapisz) dostajesz tylko aktualnie wyświetlany wariant. Pozostałe 11 wariantów nigdy nie wczytuje się do DOM, dopóki w nie nie klikniesz. To największy powód, dla którego kliknięcie prawym przyciskiem zawodzi przy poważnej analizie: strona ukrywa ~80% zasobów.

Użyj tego do: pobrania jednego zdjęcia jako szybkiej referencji. Pomiń to przy: czymkolwiek systematycznym.

Metoda 3: web scraping (gdy przetwarzasz ponad 1000 ASIN-ów)

Dla trybów pracy zespołów danych, które wrzucają tysiące ASIN-ów do bazy danych, dedykowana infrastruktura scrapująca ma sens:

  • Crawlbase / ScraperAPI / Bright Data — Zapewniają rotacyjne proxy rezydencjalne lub centrów danych oraz rozwiązywanie CAPTCHA. Ty piszesz parser; oni obsługują warstwę żądań. Licz się z kosztem 0,001–0,005 $ za żądanie na dużą skalę, plus czas inżynierski na utrzymanie selektorów w miarę jak zmienia się HTML Amazona.
  • API Keepa / Helium 10 — Wyżej poziomowe API danych produktowych. URL-e zdjęć są częścią odpowiedzi. Tańsze za ASIN, ale o niższej jakości (zwykle tylko zdjęcie główne, czasem do 7 dodatkowych).
  • ImportFromWeb — Formuła Google Sheets, która wciąga HTML Amazona do komórki. Daje URL-e do skopiowania; nie prawdziwe pobrania plików.

To wybory infrastrukturalne dla zespołu inżynierii danych, a nie tryb pracy dla pojedynczego sprzedawcy. Kompromis jest realny: zyskujesz skalę, rezygnujesz z jakości Treści A+ i bierzesz na siebie ciężar utrzymania, gdy Amazon zaktualizuje szablon strony.

Metoda 4: sztuczka z URL-em w DevTools

„Darmowa” metoda dla użytkowników technicznych:

  1. Otwórz ofertę, naciśnij F12, przejdź do zakładki Network i przefiltruj po media-amazon.
  2. Przeklikaj każdy wariant i wyświetl wszystkie 7 zdjęć produktu. Każde żądanie zostaje zarejestrowane.
  3. Dla dowolnego zarejestrowanego URL-a zdjęcia skopiuj go, usuń blok przetwarzania (wszystko między identyfikatorem zasobu a rozszerzeniem pliku) i wklej oczyszczony URL w nowej karcie. Zapisz.
  4. Aby uzyskać Treść A+, przewiń stronę, by uruchomić zdjęcia ładowane leniwie, a następnie ponownie przefiltruj Network po aplus.

To działa. To również 30-minutowe ćwiczenie na ofertę. Warto poznać tę technikę, bo mówi Ci, co wtyczka faktycznie robi pod maską; nie warto robić tego ręcznie przy jakiejkolwiek liczbie większej niż 1–2 ASIN-y.

Porównanie metod

Kryterium Wtyczka Chrome Prawy przycisk Web scraping Sztuczka DevTools
Zwraca oryginalną rozdzielczość Tak Nie (wyrenderowana pochodna) Zależnie od parsera Tak
Wszystkie warianty za jednym razem Tak (analizuje colorImages) Tylko bieżący wariant Zależnie Ręczne przeklikiwanie
Przechwycona Treść A+ Tak Ręcznie Rzadko Możliwe
Czas na ofertę ~5 s 5–20 min ~1 s na dużą skalę 15–30 min
Koszt konfiguracji Instalacja jednorazowa Brak Praca inżynierska Brak
Najlepsze zastosowanie Sprzedawcy, agencje, projektanci Hobby, jednorazowo Zespoły danych, ponad 1000 ASIN Ciekawość, nauka

Co właściwie zrobić ze zdjęciami

Większość wpisów o pobieraniu zdjęć z Amazona kończy się w tym miejscu. Ciekawa praca zaczyna się, gdy masz już pliki. Oto tryb pracy audytu, który lepsze agencje Amazona uruchamiają na nowym koncie klienta.

Krok 1: zbuduj bibliotekę zdjęć kategorii (jedno popołudnie)

Wybierz 20 najlepszych ofert w swojej kategorii. Pobierz wszystkie zdjęcia dla wszystkich 20 z manifestem CSV. Powinieneś skończyć z mniej więcej 800–1500 plikami zdjęć. Posortuj CSV według miejsca, a następnie według konkurenta.

Krok 2: zaudytuj zdjęcie główne

Otwórz 20 zdjęć głównych obok siebie w widoku stykówki. Zwróć uwagę na pięć rzeczy:

  • Wypełnienie kadru. Reguła Amazona to ≥85%. Zaskakująca liczba konkurentów jest na poziomie 60–70%. Twoje powinno być na 85–95%, bez marginesów.
  • Kąt. Większość kategorii zbiega się do jednego kąta (frontalny lekko uniesiony pod 15° dla narzędzi kuchennych, czysto frontalny dla odzieży, trzy czwarte dla elektroniki). Wyjątki to albo liderzy kategorii, którzy mogą zignorować konwencję, albo maruderzy, którzy jej nie znają.
  • Kolor i kontrast. Posortuj według koloru dominującego. Jeśli 18 z 20 ofert jest wizualnie identycznych, ruchem różnicującym jest przełamanie schematu.
  • Opakowanie kontra sam produkt. To realny podział. Kategorie subskrypcyjne/konsumpcyjne (suplementy, żywność) często pokazują opakowanie; dobra trwałego użytku rzadko. Dopasuj się do dominującego schematu, chyba że masz konkretny powód, by go przełamać.
  • Domyślne wskazówki skali. W dłoni, na stole, na półce — czy zdjęcie główne sygnalizuje rozmiar? W kategoriach z częstymi zwrotami „mniejsze niż oczekiwano” to ma znaczenie.

Krok 3: odtwórz strategię miejsc PT metodą inżynierii wstecznej

Zbuduj siatkę 8×20: PT01–PT08 na górze, 20 ASIN-ów z boku. Oznacz każdą komórkę typem zdjęcia (lifestyle / infografika / schemat wymiarów / składnik / przed-po / porównanie rozmiaru / opakowanie / miniatura wideo). Wzorce wyłaniają się w 30 sekund:

  • Jeśli 18 z 20 ofert ma infografikę w PT01, to jest konwencja. Pominięcie jej oznacza utratę momentu „co to jest”.
  • Jeśli tylko 3 z 20 używają schematu wymiarów, a Twoja kategoria ma częste skargi na rozmiary w recenzjach, to jest Twoja nieuczciwa przewaga.
  • Jeśli jakieś miejsce PT jest konsekwentnie puste w całej kategorii, wypełnij je. Amazon wyróżni je w wyszukiwaniu; konkurenci zostawiają to miejsce Tobie.

Krok 4: oceń Treść A+

Treść A+ jest mocno niewykorzystana. W większości kategorii mniej niż połowa z 20 najlepszych ofert ma sensowny moduł A+ — a z tych większość używa domyślnych szablonów ze zdjęciami w stylu banków obrazów. Zaprojektowany na zamówienie moduł A+ Premium (dostępny tylko z Brand Registry) to jedna z najtańszych wciąż dostępnych zdobyczy CTR, właśnie dlatego, że tak niewielu sprzedawców robi to dobrze.

Pytanie audytowe: z 5 najlepszych ofert, ile ma markową Treść A+ (autorska fotografia, tabela porównawcza z nazwanymi konkurentami, historia marki, zdjęcie założyciela)? Jeśli odpowiedź to zero lub jedna, to jest właśnie luka.

Krok 5: przekop zdjęcia z recenzji

Zdjęcia z recenzji klientów to najlepsze źródło uczciwego feedbacku o produkcie, jakie kiedykolwiek przeczytasz. Pobierz materiały z recenzji 5 najlepszych konkurentów. Szukaj:

  • Wzorców wad. Jeśli 30% zdjęć z recenzji pokazuje ten sam pęknięty plastikowy zatrzask, to jest Twój kąt kontroli jakości.
  • Realnej skali. Zdjęcia klientów niemal zawsze ujawniają, że produkt wygląda mniej okazale w rzeczywistości niż na zdjęciach marketingowych. Jeśli Twoi konkurenci przestylizowują, uczciwe ujęcie skali jest czynnikiem różnicującym.
  • Zastosowań, których sprzedawca nie przewidział. Autorzy recenzji często fotografują kreatywne zastosowania. Dodaj je jako miejsca PT we własnej ofercie.

Różnice między platformami, które zaskakują ludzi

System zdjęć jest taki sam na wszystkich platformach, ale konwencje i reguły już nie.

  • JP nagradza wyższą jakość. Najlepsze oferty JP konsekwentnie używają zdjęć głównych powyżej 2560 px i agresywnej gęstości infografik. Zachodnie kopie ofert marek z JP często wyglądają przy nich na zrobione byle jak.
  • DE ma surowszą weryfikację zgodności tekstu na zdjęciu. Stwierdzenia takie jak „Bestseller” czy „100% Natural” osadzone w miejscach PT są oznaczane częściej niż w US.
  • IN pozwala na nakładki z walutą i ceną w zdjęciach PT swobodniej niż US, gdzie poza tym jest to odradzane.
  • UK / EU mają te same Warunki korzystania z usługi co US w sprawie znaków wodnych (zabronionych na MAIN), ale egzekwują je mniej konsekwentnie.
  • Brand Registry odblokowuje A+ Premium, wideo w karuzeli i wideo Sponsored Brands — znacząca przepaść między ofertami zarejestrowanymi a niezarejestrowanymi w marce na każdej platformie.

Pułapki zgodności zdjęć, które zabiją Twoją ofertę

Polityka Amazona dotycząca zdjęcia głównego jest egzekwowana mechanicznie (klasyfikator zdjęć + weryfikacja ręczna przy odwołaniu). Lista częstych naruszeń:

  1. Zdjęcie główne z tekstem, plakietką, znakiem wodnym lub ramką. Automatycznie odrzucane. Obejmuje plakietki „Made in USA”, logotypy marek unoszące się w białej przestrzeni, nakładki „Best Seller”.
  2. Zdjęcie główne z twarzą osoby, gdy produkt nie jest odzieżą/kosmetykiem. Często odrzucane.
  3. Zdjęcie główne z opakowaniem, gdy produkt nie jest normalnie sprzedawany w pudełku (tzn. pudełko nie jest jednostką). Niekonsekwentnie egzekwowane, ale oznaczane w audytach.
  4. Zdjęcie główne, gdzie produkt wypełnia mniej niż 85% kadru. Wykrywane automatycznie.
  5. Zdjęcie główne nie na czystym białym tle RGB (255,255,255). Tła złamane biel lub z cieniami są wyłapywane.
  6. Lifestylowe zdjęcie PT z dłońmi lub scenami sugerującymi stwierdzenia medyczne, odchudzające lub „przed/po” w kategoriach regulowanych (suplementy, uroda). Podlega ukryciu.

Przepuść własne oferty przez tę samą kontrolę reguł, zanim wdrożysz przeprojektowanie. Liczba ukrytych ofert spowodowanych przez nadgorliwego projektanta dodającego „Top Rated” do zdjęcia głównego jest naprawdę duża.

Granica prawna

Pobieranie to łatwa część. Granica leży w tym, co robisz z plikiem:

  • Referencja i analiza — w porządku. To samo co wejście do sklepu konkurenta z notesem.
  • Bezpośrednie ponowne użycie we własnej ofercie — naruszenie praw autorskich. Amazon rozpatrzy skargę w ciągu 48 godzin i może zawiesić ofertę.
  • Istotnie podobne dzieło pochodne — ta sama kompozycja, ten sam rekwizyt, ten sam kąt, to samo opracowanie koloru wystarczy, by uruchomić usunięcie, nawet bez kopii identycznej co do piksela.
  • Zdjęcia z recenzji klientów — własność autora recenzji, nie Amazona i nie sprzedawcy. Wyłącznie do analizy wewnętrznej.

Bezpieczna reguła: cokolwiek, co byłoby niezręcznie umieścić w prezentacji pokazywanej menedżerowi marki konkurenta, jest prawdopodobnie po złej stronie linii.

Najczęściej zadawane pytania

W jakiej rozdzielczości Amazon faktycznie przechowuje zdjęcia produktów?

Amazon zachowuje oryginalny przesłany plik, zazwyczaj 1500–2560 px na dłuższym boku dla obecnych ofert — i do ponad 5000 px dla nowszych zasobów A+ Premium i obrotów 360°. Strona renderuje tylko skompresowane pochodne (zwykle 500–679 px), więc DOM strony nigdy nie ujawnia oryginału. Trzeba albo bezpośrednio zażądać URL bez parametru rozmiaru, albo użyć narzędzia, które zbuduje go za Ciebie.

Co właściwie oznaczają nazwy plików takie jak 71xKf...AC_SL1500_.jpg?

Nazwa pliku ma dwie części: identyfikator zasobu (losowe znaki przed pierwszym podkreśleniem) oraz serię flag rozmiaru i przetwarzania. _SL1500_ oznacza skalowanie dłuższego boku do 1500 px; _AC_ to standardowy kontekst renderowania; _UX466_ oznacza skalowanie do szerokości 466. Usunięcie wszystkich flag i końcowego bloku zwraca oryginał.

Czy mogę pobrać każde zdjęcie wariantu bez przeklikiwania się przez nie?

Tak. Amazon przechowuje pełny zestaw zdjęć wariantów wewnątrz obiektu JSON o nazwie colorImages (lub initial.colorImages.initial) osadzonego w HTML. ASINCrate analizuje ten obiekt bezpośrednio, więc przechwytuje wszystkie zdjęcia wariantów w jednym pobraniu, zamiast zmuszać Cię do przeglądania wariant po wariancie.

Jak pobrać zdjęcia z modułów Treści A+ i A+ Premium?

Zdjęcia Treści A+ są serwowane z innego hosta (zazwyczaj m.media-amazon.com/images/S/aplus-media lub aplus-media-library-service). Nie są częścią głównego JSON-a karuzeli zdjęć. ASINCrate skanuje DOM A+ osobno i dołącza te zasoby do tego samego ZIP-a, oznaczone APLUS_*.

Czy masowe pobieranie zdjęć produktów z Amazona narusza Warunki korzystania z usługi?

Warunki korzystania z usługi Amazona zabraniają zautomatyzowanego scrapowania, które na dużą skalę obciąża ich serwery. Wczytanie pojedynczej strony produktu we własnej przeglądarce i zapisanie zdjęć, które już Ci dostarczyła, to inna kategoria — to ten sam ruch sieciowy, który strona już wygenerowała. Ryzyko prawne nie leży w akcie zapisania; leży w tym, co robisz z plikiem. Użycie zdjęcia konkurenta we własnej ofercie to naruszenie praw autorskich, na które Amazon zareaguje.

Podsumowanie

Pipeline zdjęć jest zbudowany do dostarczania, a nie do pobierania — dlatego 5-minutowa próba kliknięcia prawym przyciskiem wydaje się trudniejsza, niż powinna. Gdy zrozumiesz, że URL jest wywołaniem API, że warianty żyją w obiekcie JSON, a Treść A+ ma własny host, całość staje się mechaniczna.

Do jednorazowej ciekawości sztuczka z usunięciem części URL-a wystarczy. Do cotygodniowych audytów konkurencji na ponad 20 ofertach — prawdziwy przypadek użycia sprzedawcy — wtyczka Chrome, która analizuje colorImages, przechodzi przez DOM A+ i zapisuje manifest CSV, to jedyny tryb pracy, który się skaluje.

Potrzebujesz pobrać też wideo? Zobacz nasz towarzyszący przewodnik o pobieraniu wideo produktów z Amazona , w tym jak naprawdę działają strumienie HLS/m3u8 i URL-e z podpisanym tokenem.

Pomiń kombinowanie z URL-ami — pobierz każde zdjęcie jednym kliknięciem

Zainstaluj ASINCrate — za darmo, bez konta, pobiera oryginały w wysokiej rozdzielczości z folderami wariantów i metadanymi CSV.

Dodaj do Chrome — za darmo

Powiązane artykuły