Nicolas Hachet 12 Avr 2011 2 Eur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUGConfirmé, MySQL

Eur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUG

, Niveaux, Trucs et astuces
No tags

MySQL permet d’importer des fichiers grâce à l’instruction LOAD DATA INFILE. Il arrive fréquement que les fichiers d’import ne possèdent pas de délimiteur et qu’il faille se baser sur la taille des champs afin de retrouver la correspondance entre champ et donnée.

MySQL permet de charger ce type de fichier sans problème mais il existe une petite subtilité à connaitre.

Utiliser l’encodage latin1 pour les tables d’import

Prenons l’exemple d’un fichier très simple (id, nom, prenom). Chaque ligne fait 35 caractères et respecte le format suivant :
[text] ID = 5 caractères
NOM = 15 caractères
PRENOM = 15 caractères
[/text]

Voici un fichier de test (/home/nhac/utilisateurs.import):
Eur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUG [text] 00001 Travolta John
00002 Dylan Bob
00003 Murhpy Eddy
[/text]

L’astuce pour charger le fichier sous MySQL est d’indiquer CHARSET ‘latin1’ lors de la création de la table. En effet, si vous spécifiez CHARSET ‘UTF8’, le chargement ne se fera pas correctement.

[sql] — Creation de la table cible
DROP TABLE IF EXISTS utilisateurs;
CREATE TABLE IF NOT EXISTS utilisateurs (
`id` CHAR(5),
`nom` CHAR(15),
`prenom` CHAR(15)
) ENGINE=MyISAM CHARSET ‘latin1’;

— Chargement du fichier
LOAD DATA LOCAL INFILE ‘/home/nhac/utilisateurs.import’Épaule Lancaster Sac Noir Dune Cabas MpUVSzq
INTO TABLE utilisateurs
FIELDS TERMINATED BY  » ENCLOSED BY  »
(
`id`, `nom`, `prenom`
);
[/sql]

Rien ne vous empêche de transférer ces données encodées en latin1 vers une table en UTF8Eur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUG après l’import.

Pourquoi faut-il utiliser latin1 lors des imports de taille fixe ?

Vous trouverez de l’info sur les liens Wikipedia ci-dessous. La chose à retenir est qu’en UTF8 les caractères sont codés sur un nombre d’octets variables (entre 1 et 4). MySQL ne peut donc pas savoir à l’avance combien il doit prévoir pour stocker les données, et donc combien de caractères il doit lire dans le fichier.
A l’inverse en latin1 (dit ISO-8859-1), les caractères sont codées sur un seul octet. MySQL sait donc qu’il doit lire un et un seul octet à partir du fichier.Eur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUG

Lien Wikipédia vers l’ISO-8859-1
Lien Wikipédia vers l’UTF8
Aller plus loin sur le sujetNkcrt Duff Sac De Sport Nike Advantage HommeNoirblackanthracite yY7gvI6bfm


Nicolas HACHET
Passionné d'Internet et des nouvelles technologies, je travaille en tant qu'expert Web / architecte technique sur les technologies PHP à Nantes (44, Loire Atlantique).
À Plaque Femme12051249 Épaule Porté Versace Sac Logo Kc7p BoerdxCW
SondageOccasion Longchamp Abaco Odelia Main A Sac sac Legende 2WHID9E

A qui faites-vous appel pour le développement de vos projets informatiques ?

Eur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUG

View ResultsEur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUG

 Loading ...

Eur Cuir Kaporal Neuf Camel Sac Toile Marine 34 Et 00 qpLzMVSUG

Les cookies nous permettent de personnaliser le contenu et les annonces, d'offrir des fonctionnalités relatives aux médias sociaux et d'analyser notre trafic. Nous partageons également des informations sur l'utilisation de notre site avec nos partenaires de médias sociaux, de publicité et d'analyse, qui peuvent combiner celles-ci avec d'autres informations que vous leur avez fournies ou qu'ils ont collectées lors de votre utilisation de leurs services. En savoir plus