Nicolas Hachet 12 Avr 2011 2 Gerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBhConfirmé, MySQL

Gerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBh

, Niveaux, Trucs et astuces
No tags

MySQL permet d’importer des fichiers grâce à l’instruction LOAD DATA INFILE. Il arrive fréquement que les fichiers d’import ne possèdent pas de délimiteur et qu’il faille se baser sur la taille des champs afin de retrouver la correspondance entre champ et donnée.

MySQL permet de charger ce type de fichier sans problème mais il existe une petite subtilité à connaitre.

Utiliser l’encodage latin1 pour les tables d’import

Prenons l’exemple d’un fichier très simple (id, nom, prenom). Chaque ligne fait 35 caractères et respecte le format suivant :
[text] ID = 5 caractères
NOM = 15 caractères
PRENOM = 15 caractères
[/text]

Voici un fichier de test (/home/nhac/utilisateurs.import):
Gerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBh [text] 00001 Travolta John
00002 Dylan Bob
00003 Murhpy Eddy
[/text]

L’astuce pour charger le fichier sous MySQL est d’indiquer CHARSET ‘latin1’ lors de la création de la table. En effet, si vous spécifiez CHARSET ‘UTF8’, le chargement ne se fera pas correctement.

[sql] — Creation de la table cible
DROP TABLE IF EXISTS utilisateurs;
CREATE TABLE IF NOT EXISTS utilisateurs (
`id` CHAR(5),
`nom` CHAR(15),
`prenom` CHAR(15)
) ENGINE=MyISAM CHARSET ‘latin1’;

— Chargement du fichier
LOAD DATA LOCAL INFILE ‘/home/nhac/utilisateurs.import’Cuir En Sur LindaÀ Main Shopping Bleu Furla Sac c4jLq53AR
INTO TABLE utilisateurs
FIELDS TERMINATED BY  » ENCLOSED BY  »
(
`id`, `nom`, `prenom`
);
[/sql]

Rien ne vous empêche de transférer ces données encodées en latin1 vers une table en UTF8Gerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBh après l’import.

Pourquoi faut-il utiliser latin1 lors des imports de taille fixe ?

Vous trouverez de l’info sur les liens Wikipedia ci-dessous. La chose à retenir est qu’en UTF8 les caractères sont codés sur un nombre d’octets variables (entre 1 et 4). MySQL ne peut donc pas savoir à l’avance combien il doit prévoir pour stocker les données, et donc combien de caractères il doit lire dans le fichier.
A l’inverse en latin1 (dit ISO-8859-1), les caractères sont codées sur un seul octet. MySQL sait donc qu’il doit lire un et un seul octet à partir du fichier.Gerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBh

Lien Wikipédia vers l’ISO-8859-1
Lien Wikipédia vers l’UTF8
Aller plus loin sur le sujetS Store Cvrt Sac Adidas Official W9IYD2HE


Nicolas HACHET
Passionné d'Internet et des nouvelles technologies, je travaille en tant qu'expert Web / architecte technique sur les technologies PHP à Nantes (44, Loire Atlantique).
Sac Dos Pepe À Jeans 44x33x21cm Roulettes Pierre 2r QBCxeWord
SondageZalando ch Bandoulière Sac Camel Maje ywPn0mNv8O

A qui faites-vous appel pour le développement de vos projets informatiques ?

Gerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBh

View ResultsGerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBh

 Loading ...

Gerard Maroquinerie Centre Stalric Commercial Balaruc txrsdQCBh

Les cookies nous permettent de personnaliser le contenu et les annonces, d'offrir des fonctionnalités relatives aux médias sociaux et d'analyser notre trafic. Nous partageons également des informations sur l'utilisation de notre site avec nos partenaires de médias sociaux, de publicité et d'analyse, qui peuvent combiner celles-ci avec d'autres informations que vous leur avez fournies ou qu'ils ont collectées lors de votre utilisation de leurs services. En savoir plus