בין הבעיות יישומי מתמודדאם לא מתכנת, אז משתמש מתקדם, ייבוא נתונים מיישום אחד למשנהו הוא לא כל כך נדיר. ולעתים קרובות יש צורך לייבא נתוני טבלה, אשר, למעשה, את הפורמט של CSV הומצא. עכשיו פיתחו כמה פתרונות חלופיים (XML הוא ביניהם). אבל יצירת קובץ CSV במקרים מסוימים נותרה הפתרון הנוח ביותר, וחלק - הבעייתי ביותר.
שם הפורמט מפוענח כערכים מופרדים, מופרדים בפסיקים. ב- Notepad, הקובץ נראה כך:
00, 01, 02, 03;
01, 15, 34, 11;
16, 27, 33, 06 (ממש בסוף זה לא הכרחי לשים סימן)
ובגיליון אלקטרוני של Excel או ביישום דומה, זה כבר המקרה:
00 | 01 | 02 | 03 |
01 | 15 | 34 | 11 |
16 | 27 | 33 | 06 |
אבל עכשיו ניתחנו את המקרה הפשוט ביותר. הבעיות מתחילות דווקא בגלל ייצוג הנתונים הדחוס מאוד, פורמט ה- CSV משמש להעברת כמויות גדולות של מידע. לרוב במסדי הנתונים יש ערכים שונים: דיגיטלי, אלפביתי, אלפביתי, עם רווחים, וכו ' לעתים קרובות במערכים גדולים יש שגיאות, ואם, למשל, אי שם מופיע פסיק נוסף בתוך התוכן של אחד השדות, כל התאים יכולים לעבור אחד.
באופן כללי, הבעיות המתעוררות בעת ייבוא נתונים באמצעות פורמט קובץ CSV ניתן לחלק לשלוש קטגוריות:
1 - מילוי שדה שגוי.
2 - המרה שגויה של נתונים בעת שמירת קובץ ב- CSV.
3 - זיהוי פורמט שגוי על ידי תוכנית הייבוא.
המקרה הראשון כבר נבדק חלקית. כדי להתמודד עם הבעיה, יש צורך לספק אמצעים כדי לשלוט על נכונות הנתונים קלט. לדוגמה, אם אתה צריך לבנות מסד נתונים כתובת לרשימת דיוור, ישנם סקריפטים מיוחדים לבדוק אם האדם הזין את הדואר האלקטרוני שלהם בפורמט הרצוי. כאשר יש רווחים, פסיקים ונתונים אחרים שניתן לקרוא בהם בצורה שגויה, התוכן של השדה חייב להיות מוקף במרכאות (מחשב שנקרא "").
המקרה השני קשור לבחירת הקידוד. יש צורך לגלות, לעתים קרובות על ידי ניסיון, מה קידוד יבואן התוכנית יעדיפו. ב- Windows, 1251 מוחל אוניברסלית, כך שאם קובץ המקור פוגש טקסט Unicode, הוא יוצג ביישום הנמען כרשת של שאלות. ב- Excel, ניתן לשמור בתבנית CSV עם קידוד ותיחום שונים (למעט פסיק, כרטיסייה ונקודה פסיק), אך מומלץ ליצור קובץ ב- Notepad ++ או OpenOfficeCalc.
המקרה השלישי הוא תוצאה של השני. מבחינה היסטורית, בפורמט CSV אין תקן אחד. תוכניות רבות מקבלות גם קובצי CSV של הפרדות TSV (מופרדות באמצעות טאבים) ו- SCSV (סימני נקודה), במיוחד משום שתוסף הקובץ אינו מדווח על כך. במקרה זה, הנתונים נקראים בטעות ולא מופץ בתאים בסדר הרצוי. הטוב ביותר שניתן לייעץ הוא ליצור קובץ CSV עם היד שלך. כאמור, עבור זה אתה צריך להשתמש בעורך נוח.
הטריקים של איך לאלף את הפורמט CSV ידועיםמתכנתים. זה מספיק עבור משתמש פשוט לעקוב אחר ההמלצות שלנו ליצירת קובץ. הבעיה הקטנה ביותר מתרחשת כאשר הקובץ נוצר במיוחד עבור ייבוא ליישום ספציפי (זה קורה גם בדרך אחרת). קל יותר לקחת בחשבון את כל הבעיות האפשריות המתעוררות בדרך של העברת נתונים.
</ p>>