informacje na temat struktury plików xml

Transkrypt

informacje na temat struktury plików xml
I NFORMACJE NA
TEMAT STRUKTURY
PLIKÓW XML
(OSTATNIA MODYFIKACJA 2008.05.28)
1. OGÓLNE ZAŁOŻENIA DO PLIKU.
W pierwszej fazie przygotowania pliku xml, należy zastanowić się jakiej branży jest
asortyment sklepu. Dobrze przygotowany plik z wystarczającą ilość informacji
będzię podstawą do szybkiego zintegrowania produktów w Ceneo.pl. Istnieje kilka
specyfikacji plików, różniących się jedynie ilością dodatkowych informacji
(atrybutów). Rodzaje plików znajdują się w punkcie 2.
Plik należy przygotować w jednym z trzech dostępnych typów kodowań:
Central European – ISO­8859­2
Central European – Windows 1250
Unicode – UTF­8
Przygotowany plik należy umieścić pod adresem http, po czym podać nam do pliku
link. Oferta aktualizowana jest automatycznie z wcześniej podanego linku ( czyli
plik na serwerze musi być nadpisywany, aby link nie zmieniał swojej nazwy ) Nie
aktualizujemy oferty na podstawie plików wysyłanych na maila. Plik nie musi mieć
rozszerzenia xml – może być php, txt, apsx, html.
2. RODZAJE PLIKÓW XML.
Aby można było poprawnie zintegrować produkt, w pliku musza być zawarte
podstawowe dane na jego temat.
Jeżeli produkt jest firmowy w pliku musi być zawarta informacja o
producencie oraz modelu/kodzie producenta.
Poniżej przedstawiono listę atrybutów wymaganych dla specyficznych branż. W celu
zapoznania się z przykładowym xml’em dla danej branży, kliknij na specyfikację,
która Cię interesuję.
1.
2.
3.
4.
5.
6.
7.
Ogólny
Komputery
Książki
Opony
Perfumy ( drogeria )
Filmy
Felgi aluminiowe
Wzór ogólny ­ dotyczy wszystkich branż oprócz tych, które zostały wymienione w
podpunktach od 2 do 7 ( np. AGD, RTV, fotografia, telefony, zabawki, armatura
sanitarna itd. dotyczą wzoru ogólnego ).
Przykłady różnią się jedynie atrybutami występującymi w pliku. Poza tym
struktura znaczników w każdym z przypadków jest taka sama.
W tabeli poniżej przedstawiono opis atrybutów występujących w plikach xml dla
odpowiednich branż. Ważne jest, aby była zachowana kolejność atrybutów.
ATRYBUT
Rodzaj ogólny
Producent
Model
Rodzaj dla sklepu komputerowego
Kod_producenta
Producent
Rodzaj dla księgarni
Autor
ISBN
Ilosc_stron
Wydawnictwo
Rodzaj dla sklepu z oponami
Producent
OPIS
Producent
Model/kod producenta/numer katalogowy
Unikatowy kod, umieszczany przez producenta
przy produkcie
Producent produktu
Autor książki
Unikatowy numer książki
Ilość stron w książce
Wydawnictwo
Producent
Model
Szerokosc
Profil
Srednica
Predkosc
Nosnosc
Sezon
Typ_pojazdu
Rodzaj dla perfum ­ drogerii
Producent
Model
Szerokość
Profil
Średnica
Prędkość
Nośność
Sezon (letni/zimowy)
Typ pojazdu
Model
Rodzaj
Pojemnosc
Rodzaj dla sklepu z filmami
Rezyser
Model
Rodzaj
Pojemność
Obsada
Nosnik
Tytul_oryginalny
Rodzaj dla sklepu z felgami
Producent
Obsada
Nośnik
Tytuł oryginalny
Rozmiar
Rozstaw_srub
Odsadzenie
Producent
Reżyser
Producent
Rozmiar
Rozstaw śrub
Odsadzenie
Istnieje możliwość, że danego atrybutu nie będzie. Wartość takiego atrybutu należy
wtedy pozostawić pustą – atrybut jako taki musi istnieć ( kolejność atrybutów musi
pozostać bez zmian ).
3. PARAMETRY W PLIKU.
PARAMETR
WYMAGANY
id
tak
name
tak
price
tak
url
tak
categoryId
tak
description
nie image
tak
OPIS
Identyfikator produktu.
Każdy produkt w sklepie musi posiadać unikatowy,
niezmienny identyfikator (w postaci liczby lub ciągu
znaków) zwany id. Najczęściej występuje on również w
adresie http. ID nie można nadpisywać!
Nazwa produktu.
W nazwie nie mogą znajdować się tagi html. Jeśli występują
nawiasy ostre, czyli < >, należy zapisać je w postaci nie
jawnej (zamienniki znajduje się w tabelce poniżej).
Można zastosować sekcje CDATA
Cena produktu
Musi być wartością liczbową. Złotówki od groszy
oddzielamy przecinkiem lub kropką. Np. 120.99 lub 120,99
Cena musi być z vat’em. Pamiętamy, aby uwzględnić ceny
promocyjne.
Adres http, pod którym znajduje się produkt.
Kategoria, w której znajduje się produkt.
Powinna być dokładnie sprecyzowana. Dla monitorów LCD
powinno być np. ‘Komputery/Monitory/Monitory LCD’
Błędem jest podanie samego słowa ‘Monitory’.
Uwaga! Sugerujemy przygotowanie kategorii o nazwach
identycznych jak na Ceneo. Struktura kategorii znajduje się
pod adresem: http://api.ceneo.pl/Kategorie/dane.xml
Można zastosować sekcje CDATA
Opis pr oduktu. Nie może zawierać tagów html. Dopuszczalne są jedynie
<br> <li> <p> <ul> oraz <tr>
przy czym nawiasy ostre koniecznie muszą być zapisane w
postaci zamienników (patrz tabelka poniżej).
Np. <br> powinno być zapisane jako &lt;br&gt;
Można zastosować sekcje CDATA
Adres http dużego zdjęcia produktu.
Brak zdjęcia w pliku dla produktu, który zostanie
zakwalifikowany jako nowy w Ceneo ( nie mający porównań
z innymi sklepami ), spowoduje wyświetlenie jego oferty bez
zdjęcia. Minimalny rozmiar zdjęcia to 100x100
Nie prezentujemy zdjęć zawierających logo sklepu.
Oprócz wymienionych znaczników plik musi zawierać odpowiedni nagłówek i stopkę
Rys.1 Tagi zaczynające plik
Rys.2 Tagi kończące plik
4. PODSUMOWANIE.
Link do pliku xml z ogólną strukturą ­
http://secure.ceneo.pl/Admin2/XMLtemp/ceneo_xml.xml
Link do kategorii ( plik generowany dynamicznie ) ­
http://api.ceneo.pl/Kategorie/dane.xml