Nicolas Hachet 12 Avr 2011 2 Médium Silk Saint RobeSac Yves Laurent Nwm8y0OvnConfirmé, MySQL

Médium Silk Saint RobeSac Yves Laurent Nwm8y0Ovn

, Niveaux, Trucs et astuces
No tags

MySQL permet d’importer des fichiers grâce à l’instruction LOAD DATA INFILE. Il arrive fréquement que les fichiers d’import ne possèdent pas de délimiteur et qu’il faille se baser sur la taille des champs afin de retrouver la correspondance entre champ et donnée.

MySQL permet de charger ce type de fichier sans problème mais il existe une petite subtilité à connaitre.

Utiliser l’encodage latin1 pour les tables d’import

Prenons l’exemple d’un fichier très simple (id, nom, prenom). Chaque ligne fait 35 caractères et respecte le format suivant :
[text] ID = 5 caractères
NOM = 15 caractères
PRENOM = 15 caractères
[/text]

Voici un fichier de test (/home/nhac/utilisateurs.import):
Médium Silk Saint RobeSac Yves Laurent Nwm8y0Ovn [text] 00001 Travolta John
00002 Dylan Bob
00003 Murhpy Eddy
[/text]

L’astuce pour charger le fichier sous MySQL est d’indiquer CHARSET ‘latin1’ lors de la création de la table. En effet, si vous spécifiez CHARSET ‘UTF8’, le chargement ne se fera pas correctement.

[sql] — Creation de la table cible
DROP TABLE IF EXISTS utilisateurs;
CREATE TABLE IF NOT EXISTS utilisateurs (
`id` CHAR(5),
`nom` CHAR(15),
`prenom` CHAR(15)
) ENGINE=MyISAM CHARSET ‘latin1’;

— Chargement du fichier
LOAD DATA LOCAL INFILE ‘/home/nhac/utilisateurs.import’Buzz Sac Puma Dos Flash À Vente 14 dCoerxBW
INTO TABLE utilisateurs
FIELDS TERMINATED BY  » ENCLOSED BY  »
(
`id`, `nom`, `prenom`
);
[/sql]

Rien ne vous empêche de transférer ces données encodées en latin1 vers une table en UTF8Médium Silk Saint RobeSac Yves Laurent Nwm8y0Ovn après l’import.

Pourquoi faut-il utiliser latin1 lors des imports de taille fixe ?

Vous trouverez de l’info sur les liens Wikipedia ci-dessous. La chose à retenir est qu’en UTF8 les caractères sont codés sur un nombre d’octets variables (entre 1 et 4). MySQL ne peut donc pas savoir à l’avance combien il doit prévoir pour stocker les données, et donc combien de caractères il doit lire dans le fichier.
A l’inverse en latin1 (dit ISO-8859-1), les caractères sont codées sur un seul octet. MySQL sait donc qu’il doit lire un et un seul octet à partir du fichier.Médium Silk Saint RobeSac Yves Laurent Nwm8y0Ovn

Lien Wikipédia vers l’ISO-8859-1
Lien Wikipédia vers l’UTF8
Aller plus loin sur le sujetEastpak Roses Boucles À 87i Dos Perles Sac 10l Frick Xs 44k Sports 9WEDH2IY


Nicolas HACHET
Passionné d'Internet et des nouvelles technologies, je travaille en tant qu'expert Web / architecte technique sur les technologies PHP à Nantes (44, Loire Atlantique).
À Collection Sur Zalando Sacs DosNouvelle dsxtBhQCr
SondagePorté Sac Guess 7176220 Edisac be Sur Épaule Hwve Heidi c5j43RqAL

A qui faites-vous appel pour le développement de vos projets informatiques ?

Médium Silk Saint RobeSac Yves Laurent Nwm8y0Ovn

View ResultsMédium Silk Saint RobeSac Yves Laurent Nwm8y0Ovn

 Loading ...

Médium Silk Saint RobeSac Yves Laurent Nwm8y0Ovn

Les cookies nous permettent de personnaliser le contenu et les annonces, d'offrir des fonctionnalités relatives aux médias sociaux et d'analyser notre trafic. Nous partageons également des informations sur l'utilisation de notre site avec nos partenaires de médias sociaux, de publicité et d'analyse, qui peuvent combiner celles-ci avec d'autres informations que vous leur avez fournies ou qu'ils ont collectées lors de votre utilisation de leurs services. En savoir plus