בעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים
-
יש באזור האישי את רשימת העמודים שתפסת, תגלול למטה. בכל אחד יש חץ שבלחיצה עליו אתה מגיע לעמוד.
בנוסף סודר אתמול שהעמודים שעדיין לא הושלמו תמיד יהיו בתחילת הרשימה. -
אחרי קריאת הכללים, יש משהו שכדאי לחשוב עליו. אם אי פעם ירצו להוסיף קישור ישיר לספר הישן (למי שמחזיק על המחשב), נניח שהוא נתקל בטקסט שנראה לו טעות ורוצה לבדוק או כדי לתקן באוצריא בוודאות ולא מסברא, כעת זה בקלות מאוד ליצור קישור כזה, לפי כללי העריכה נראה לי שזו תהיה טירחה עצומה בהמשך. מקווה שאני טועה וזה מחושב כבר כעת (או שהוחלט שזה לא יעניין גם בעתיד).
-
אחרי קריאת הכללים, יש משהו שכדאי לחשוב עליו. אם אי פעם ירצו להוסיף קישור ישיר לספר הישן (למי שמחזיק על המחשב), נניח שהוא נתקל בטקסט שנראה לו טעות ורוצה לבדוק או כדי לתקן באוצריא בוודאות ולא מסברא, כעת זה בקלות מאוד ליצור קישור כזה, לפי כללי העריכה נראה לי שזו תהיה טירחה עצומה בהמשך. מקווה שאני טועה וזה מחושב כבר כעת (או שהוחלט שזה לא יעניין גם בעתיד).
-
@יום-חדש-מתחיל כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@11 כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
כעת זה בקלות מאוד ליצור קישור כזה,
איך?
האפשרות הקלההקיימת כיום, היא לסמן מעברי עמודים גם אחרי שמאחדים את הטקסט לקבצים שלמים (לפי מספרי הPDF), ואז להגדיר בקלות שיפתח את הPDF בעמוד הנכון. האפשרות הזו תשאר כל זמן שהטקסטים יהו פר עמוד. את זה אפשר לעשות גם תכנותית כעת ודי בקלות.
הבעיה היא שזה ידע לפתוח את העמוד אבל לא לסמן את המילים הנכונות, ובפרט בחיפוש מורכב במרחקי מילים ובהחלפת אותיות, זה מאבד הכל (אא"כ הכוונה שהPDF ישמש רק כגיבוי לשעת חירום ולבדיקות, שאז זה לא נורא). בשביל סימון המילים סטייל אוצר החכמה צריך להחליף את הטקסט המקורי בשכבת פענוח. בשביל זה צריך כבר כעת שהפענוח יסמן שכבת קואורדינטות, כלומר שתיקון מילה לא יהיה סתמי אלא שידע בדיוק איזה מילה הוא מתקן, ומשם להמשיך הלאה.
אפשרות שניה ופחות מומלצת היא שלא לעשות את זה אלא אחר כך להריץ סקריפט שיזהה לפי הOCR הקיים מיקומי מילים ויתקן את השכבת טקסט, בספרים ישנים זה צפוי לפורענויות.
אפשרות שלישית, אולי הכי קלה, אבל צריך לחשוב היטב על ההשלכות שלה ועל הקושי בשימוש הלאה, לוותר על שכבת הפענוח לגמרי, ולשמור על מעברי השורות, ואחר כך לנסות להגדיר שיחליף טקסט משורה לשורה בלי לבחון טקסט. (הייתי מנסה להגדיר אחרת בכזה מצב, שיבחן את גודל הטקסט, יחלק למספר השורות שיש בעמוד, ויסמן נ.צ. משוער ולא מדוייק, שזה יתן לרוב פענוח מוחלט, ויחסוך במקביל נפח אדיר למחזיקי קבצי PDF כי לא יהיה צורך בשכבת טקסט כלל). לא בטוח שזה יעבוד טוב, וצריך לחשוב על הכשלים. -
@יום-חדש-מתחיל כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@11 כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
כעת זה בקלות מאוד ליצור קישור כזה,
איך?
האפשרות הקלההקיימת כיום, היא לסמן מעברי עמודים גם אחרי שמאחדים את הטקסט לקבצים שלמים (לפי מספרי הPDF), ואז להגדיר בקלות שיפתח את הPDF בעמוד הנכון. האפשרות הזו תשאר כל זמן שהטקסטים יהו פר עמוד. את זה אפשר לעשות גם תכנותית כעת ודי בקלות.
הבעיה היא שזה ידע לפתוח את העמוד אבל לא לסמן את המילים הנכונות, ובפרט בחיפוש מורכב במרחקי מילים ובהחלפת אותיות, זה מאבד הכל (אא"כ הכוונה שהPDF ישמש רק כגיבוי לשעת חירום ולבדיקות, שאז זה לא נורא). בשביל סימון המילים סטייל אוצר החכמה צריך להחליף את הטקסט המקורי בשכבת פענוח. בשביל זה צריך כבר כעת שהפענוח יסמן שכבת קואורדינטות, כלומר שתיקון מילה לא יהיה סתמי אלא שידע בדיוק איזה מילה הוא מתקן, ומשם להמשיך הלאה.
אפשרות שניה ופחות מומלצת היא שלא לעשות את זה אלא אחר כך להריץ סקריפט שיזהה לפי הOCR הקיים מיקומי מילים ויתקן את השכבת טקסט, בספרים ישנים זה צפוי לפורענויות.
אפשרות שלישית, אולי הכי קלה, אבל צריך לחשוב היטב על ההשלכות שלה ועל הקושי בשימוש הלאה, לוותר על שכבת הפענוח לגמרי, ולשמור על מעברי השורות, ואחר כך לנסות להגדיר שיחליף טקסט משורה לשורה בלי לבחון טקסט. (הייתי מנסה להגדיר אחרת בכזה מצב, שיבחן את גודל הטקסט, יחלק למספר השורות שיש בעמוד, ויסמן נ.צ. משוער ולא מדוייק, שזה יתן לרוב פענוח מוחלט, ויחסוך במקביל נפח אדיר למחזיקי קבצי PDF כי לא יהיה צורך בשכבת טקסט כלל). לא בטוח שזה יעבוד טוב, וצריך לחשוב על הכשלים. -
@11 לא חושב שרלוונטי להגדיר לפי מיקום בהוצאה ישנה כזו,
ואם מישהו ישיג PDF יותר טוב,
בסופו של דבר תמיד ניתן להגדיר ב PDF כותרות כמו בטקסט, לפי סימנים וכדו', ואז זה יעביר למיקום המדוייק,
ובקיצור, העבודה במקרה הזה צריכה להיות על ה PDF ולא על הטקסט.אגב, עבודה כזו כבר עשה @יהודי-צעיר על המשנה ברורה לדוגמא [וגם על עוד ספרים] נמצא במאגר הגיטאהב של @יאיר-דניאל ר
-
@הבל-הבלים כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@11 המטרה שלנו היא להשיג טקסט, לא PDF עם שכבת טקסט.
התוכנה מבוססת על מאגר טקסט.מקובל, אתה בעל הבית, עשה כהבנתך.
רק משקף לך שני דברים מהותיים.- אם יום אחד תחחרט הקושי יהיה מטורף. היום זה קל מאוד.
- אם תמצא טעות בטקסט, הקושי לאתר את המקור כדי לוודא שזה טעות, הוא עצום. אם אתה מזהה מיקום מדוייק אתה יכול בשניה אחת לבדוק ולתקן.
-
@הבל-הבלים כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@11 המטרה שלנו היא להשיג טקסט, לא PDF עם שכבת טקסט.
התוכנה מבוססת על מאגר טקסט.מקובל, אתה בעל הבית, עשה כהבנתך.
רק משקף לך שני דברים מהותיים.- אם יום אחד תחחרט הקושי יהיה מטורף. היום זה קל מאוד.
- אם תמצא טעות בטקסט, הקושי לאתר את המקור כדי לוודא שזה טעות, הוא עצום. אם אתה מזהה מיקום מדוייק אתה יכול בשניה אחת לבדוק ולתקן.
@11 לא הבנתי את דבריך בכלל.
אנחנו לא הולכים להכניס לתוכנה קובץ PDF, אז איפה אתה חושב יאוחסן ה PDF עם הקישורים לטקסט? מי יזהה טעות? מי יבדוק את זה?
ולמה שלא יוציא את הספר מהארון, יפתח סימןX ס"ק Y, ויבדוק את המקור? למה צריך אאת מה שממנו עשו את הטקסט? -
@11 לא חושב שרלוונטי להגדיר לפי מיקום בהוצאה ישנה כזו,
ואם מישהו ישיג PDF יותר טוב,
בסופו של דבר תמיד ניתן להגדיר ב PDF כותרות כמו בטקסט, לפי סימנים וכדו', ואז זה יעביר למיקום המדוייק,
ובקיצור, העבודה במקרה הזה צריכה להיות על ה PDF ולא על הטקסט.אגב, עבודה כזו כבר עשה @יהודי-צעיר על המשנה ברורה לדוגמא [וגם על עוד ספרים] נמצא במאגר הגיטאהב של @יאיר-דניאל ר
@יום-חדש-מתחיל כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@11 לא חושב שרלוונטי להגדיר לפי מיקום בהוצאה ישנה כזו,
ואם מישהו ישיג PDF יותר טוב,
בסופו של דבר תמיד ניתן להגדיר ב PDF כותרות כמו בטקסט, לפי סימנים וכדו', ואז זה יעביר למיקום המדוייק,
ובקיצור, העבודה במקרה הזה צריכה להיות על ה PDF ולא על הטקסט.אגב, עבודה כזו כבר עשה @יהודי-צעיר על המשנה ברורה לדוגמא [וגם על עוד ספרים] נמצא במאגר הגיטאהב של @יאיר-דניאל ר
אם כל הטקסטים יהיו ישנים, אתה צודק. אבל יש טקסטים טובים.
ומלבד זאת, הגדרת סימן כל שהוא למעברי שורות ועמודים הוא דבר מאוד קל כיום, כל שינוי בתוכנית יעלה ביוקר רב. לא חבל? -
@11 לא הבנתי את דבריך בכלל.
אנחנו לא הולכים להכניס לתוכנה קובץ PDF, אז איפה אתה חושב יאוחסן ה PDF עם הקישורים לטקסט? מי יזהה טעות? מי יבדוק את זה?
ולמה שלא יוציא את הספר מהארון, יפתח סימןX ס"ק Y, ויבדוק את המקור? למה צריך אאת מה שממנו עשו את הטקסט?@הבל-הבלים כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@11 לא הבנתי את דבריך בכלל.
אנחנו לא הולכים להכניס לתוכנה קובץ PDF, אז איפה אתה חושב יאוחסן ה PDF עם הקישורים לטקסט? מי יזהה טעות? מי יבדוק את זה?
ולמה שלא יוציא את הספר מהארון, יפתח סימןX ס"ק Y, ויבדוק את המקור? למה צריך אאת מה שממנו עשו את הטקסט?אסביר.
נניח שאני פותח כעת חוות דעת ורואה מילה שנראית לי משובשת. אם יש לי על המחשב את הPDF שממנו זה נעשה, ואני יכול בלחיצת כפתור קטנה לעבור למיקום המדוייק, אני מתקן את זה ברגע אחד. אם אני צריך ללכת לארון, ולגלות שאין לי את הספר, ואז ללכת לבית כנסת הסמוך לחפש, אבל גם שם אין, אז לפחות עוצר לשתות קפה, ואז מגיע זמן מעריב, ואחרי מעריב חוזר ושוכח מה רציתי, הסיכוי שמישהו יתקן משהו הוא אפסי עד מינוס. -
@הבל-הבלים כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@11 לא הבנתי את דבריך בכלל.
אנחנו לא הולכים להכניס לתוכנה קובץ PDF, אז איפה אתה חושב יאוחסן ה PDF עם הקישורים לטקסט? מי יזהה טעות? מי יבדוק את זה?
ולמה שלא יוציא את הספר מהארון, יפתח סימןX ס"ק Y, ויבדוק את המקור? למה צריך אאת מה שממנו עשו את הטקסט?אסביר.
נניח שאני פותח כעת חוות דעת ורואה מילה שנראית לי משובשת. אם יש לי על המחשב את הPDF שממנו זה נעשה, ואני יכול בלחיצת כפתור קטנה לעבור למיקום המדוייק, אני מתקן את זה ברגע אחד. אם אני צריך ללכת לארון, ולגלות שאין לי את הספר, ואז ללכת לבית כנסת הסמוך לחפש, אבל גם שם אין, אז לפחות עוצר לשתות קפה, ואז מגיע זמן מעריב, ואחרי מעריב חוזר ושוכח מה רציתי, הסיכוי שמישהו יתקן משהו הוא אפסי עד מינוס.@11 אבל לא הולכים להכניס למשתמש את כל קבצי המקור של הטקסט.
חוץ מזה, מה ההבדל בין העבודה עכשיו לאחרי זה? אין פה איזה תוכנת OCR שיודעת איפה הטקסט שחולץ נמצא ב PDF, יש רק את הטקסט וזהו, יש גם כאלה שמקלידים ידנית, יש אם ג'מיני, כך שזה לא כ"כ רלוונטי נראה לי, חוץ מעמוד לעמוד, וזה לא כזה קשה בכלל, אף פעם. -
@11 כל זמן שאוצריא לא נותנת למשתמשים את קבצי ה PDF אין שום משמעות לדבריך.
על זה עוד לא ענית. -
@11 כל זמן שאוצריא לא נותנת למשתמשים את קבצי ה PDF אין שום משמעות לדבריך.
על זה עוד לא ענית.@יום-חדש-מתחיל כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
כל זמן שאוצריא לא נותנת למשתמשים את קבצי ה PDF אין שום משמעות לדבריך.
אבל אפשר לעבור להיברובוקס.
-
@יום-חדש-מתחיל כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
כל זמן שאוצריא לא נותנת למשתמשים את קבצי ה PDF אין שום משמעות לדבריך.
אבל אפשר לעבור להיברובוקס.
@י.-פל. כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
@יום-חדש-מתחיל כתב בבעיה | חסרה הדרכה בסיסית לספרים בעלי כמה מפרשים:
כל זמן שאוצריא לא נותנת למשתמשים את קבצי ה PDF אין שום משמעות לדבריך.
אבל אפשר לעבור להיברובוקס.
כמו עד היום. מי לינק למעבר לעמוד המסויים. מי שיש לו על המחשב יוכל לפתוח ישירות
-
כדאי לתת את הדעת על ענין שיש לו השלכות בזה, שיש הרבה הבדלים בין אותו ספר ממש. וההבדל בין חידושי הרמב"ן של מוה"ק לשל הירוקים לשל השחורים וכו' הם הבדלים עצומים. בבר אילן כתבו לכל ספר מה ההוצאה שלו. בספריא כנ"ל. בספריית אוצריא אם לא תהיה מדיניות כזו (בהנחה שלא יהיה קישור לPDF), צריך להתוות קו ברור איך בוחרים ספר.
-
-
אז צריך לשאול את לא מתייאש האם הוא הכניס את זה לטבלאות ה DB שלו.
