דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
1

11

@11
אודות
פוסטים
57
נושאים
9
שיתופים
0
קבוצות
0
עוקבים
0
עוקב אחרי
0

פוסטים

פוסטים אחרונים הגבוה ביותר שנוי במחלוקת

  • הצעת ייעול | הגהה של ספרים באתר
    1 11

    שוחחתי הבוקר בארוכה עם המומחה שלי לענייני סטטיסטיקה ותוכן.
    מה שיצא לנו זה זה רעיון בערך כזה (מקווה לנסות ליישם בקרוב):

    1. לקחת מאגר ספרים גדול מאוד של סריקות, כמו לדוגמה היברובוקס, ולהריץ מודל ocr, אבל להכניס ממנו רק את התוצאות שמוגדרות בסריקה כרמת וודאות של 95 אחוז ומעלה (רוב כלי הOCR גם כותבים רמת וודאות).
    2. המילים הנ"ל נכנסות למאגר מילוני, וכעת התוכנה מחפשת מילים שאינן במילון שיכולות להכנס בעזרת החלפת אות אחת (אולי עדיף בשלב ראשון רק החלפת אותיות דומות בעברית, כמו ה' וח' או ב' וכ').
    3. המילון מחליף את התמונה, ובו זמנית מזהה שמהיום תמונה של בראשיח היא בעצם בראשית, וזה נכנס לרמת וודאות גבוהה ונוסף למילון כבראשית.
    4. בכל הרצה נוספים מילים נוספות למילון, בשעה שמילה שאינה קיימת בעברית/לשה"ק לא תוכל להכנס אלא אם היא ברמת וודאות של 100 אחוז.
    5. הרצה נוספת שצריך לשקול באיזה שלב, לקחת קורפוס כזה או אחר (יש כמה חינמיים), ולהוסיף למילון לאחר שמיצינו את הבעיות. (בו זמנית כל קורפוס מכיל סטטיסטיקות של סבירות תדירות אותיות, צריך לשקול שימוש בזה).
    6. הרצה נוספת שצריך לשקול באיזה שלב, חיפוש רצף מילים, נניח 10 מילים זהות שנמצאות במקום אחר בשינוי אות אחת, שיבנה לפי סטטיסטיקות. אחר כך יורד ל9 וכן הלאה.

    כל זה נשמע מסובך מאוד, כי זה מסובך מאוד, אבל כבר אמר הגר"א שהעקשן יצליח, ואני מתכוון בעז"ה להתעקש.
    הבעיה הגדולה כאן היא שכל טעות בתכנון עלולה לעלות ביוקר רב. ולכן אשמח לכל משוב ותוספת רעיונות וכו'.

    אתר 'ספריית אוצריא'

  • הצעת ייעול | הגהה של ספרים באתר
    1 11

    יש בזה הבדל מאוד מהותי אם אתה מעוניין בPDF עם תוצאה או שאתה מעוניין בטקסט. כי אם אתה מעוניין בחיפוש סטייל אוצר החכמה שתמצא בתוך הPDF אפשר במקביל להריץ כמה וכמה סריקות OCR, מכמה ספריות קיימות שעושות את זה בצורות שונות זו מזו.
    ואמנם PDF בנוי לשכת טקסט אחת, אבל אפשר במקביל להריץ חיפוש תמיד בקובץ טקסט שיזהה את המיקום (בניתי מעין כלי כזה בעבר כך שאני יודע שזה אפשרי, וחבל על דאבדין). יש כמה ספריות חינמיות של OCR, ולענ"ד אין צורך בכלל להשתמש מעבר לזה, כי פענוח מקביל של 3-4 ספריות, יתן תוצאות ברמה מאוד גבוהה.
    מצד שני, אם רוצים לייצר טקסט מבלי לצפות בדף החיפוש, אין ברירה אלא לבחור טקסט אחד, ואז נתקלים במחסום.

    אתר 'ספריית אוצריא'

  • באג | בעיות בגרסת הDB - כאן!
    1 11

    באיתור יש שיבוש

    image.png
    לא נראה כמו מסכת ברכות

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    @הבל-הבלים כתב בבאג | פרטי ספר שיש PDF:

    @11 תבדוק, אולי [אין לי כוח לבדוק] כשאתה על מצב תצוגת רשת [ולא רשימה], יש את המידע על הספרים של ספריא, באייקון כזה, אולי גם על זה יש.

    גם בתצוגת רשת אין

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    @דאנציג כתב בבאג | פרטי ספר שיש PDF:

    @י.-פל. כתב בבאג | פרטי ספר שיש PDF:

    הכיתוב ממשיך להיות "פתח באתר" [ואיך אתה פותח את הקובץ? דרך שם? אז יש לך את המידע].

    לפי מה שאני מבין, הוא הכניס את התיקייה שאליה הוא הוריד את הספר 'בית יהודה' כתיקיית היברובוקס, ולא שינה את השם של הקובץ, אלא השאיר אותו עם המספור של היברובוקס, וכאשר הוא מחפש את 'שם הספר' 'אוצריא' מוצאת את הספר על פי המזהה מהיברובוקס אפילו שהוא לא שינה את השם, אבל בלחיצה על הספר הספר נפתח, והוא בעצם רוצה שיהיה לו את פרטי הספר.

    @11 האם הבנתי אותך נכון?
    אם כן, הבקשה אמורה להיות 'הוספת פרטי ספר / מחבר מספרי היברובוקס על פי הID שלהם'.

    כן, אבל לא מבין את הניסוח הכבד.
    מה דעתך על הניסוח הזה:
    כאשר אני מחפש ספר שקיים בהיברו בוקס ואין לי אותו על המחשב אני רואה את פרטי הספר ושנת ההדפסה, אבל כאשר יש לי אותו על המחשב אני רואה רק את הקובץ PDF, אבל לא יכול לגשת לפרטי הספר דרך התוכנה.

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    image.png

    מי גילה לאוצריא שיש לי את הספר בית יהודה? זה מובנה. כשיש לי אותו זה מזוהה לבד דרך האינדקס.

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    אנסה שוב.
    כשאני מוריד לתיקיה של היברו בוקס את הקבצים הללו

    image.png
    וכך הם אצלי בתיקיה.
    התוכנה בכל אופן יודעת לזהות כשאני מחפש את הספר "מכתב גלוי" להציג לי את הספר מספר 33728.
    מי לימד את אוצריא שהספר מכתב גלוי הוא מספר זה? האינדקס. אותו אינדקס שבו כתוב

    image.png

    ברגע שהכנסתי את הספר לתיקיה, בכל פעם שאני לוחץ על מכתב גלוי אני מגיע אוטומטית לקובץ PDF הזה.
    אבל, מאותו רגע אני כבר לא רואה את הפרטים של הספר.

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    כי זה לא חוקי

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    למה צריך שזה יזהה את הPDF? הוא כבר מזהה איזה PDF להכניס לי לפי המספר, כל מה שחסר זה שיכניס גם את המידע שיש לו גם לפי המספר.
    אין ענין לעזור למי שיתחכם וישנה את המספר של הספר

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    רבונו של עולם, לא מבין מה מסובך כאן.
    אני רואה ספר באוצריא, אני רואה את הפרטים שלו. חשקה נפשי שיהיה לי אותו על המחשב, אני מוריד אותו, ומאותו רגע לא יכול לראות יותר את הפרטים של הספר שקיבלתי קודם.
    שלב שני, הספר מכיל שכבה פנימית של טקסט. אני מכניס לאוצריא ולאינדקס, ולא מצליח לחפש.
    עכשיו אנא תחדד, מה אני לא אמור לראות כמשתמש שלא השתמש בבית מלא ספרים? האם הספרים שלי לא יקראו על ידי אוצריא? האם אני מאבד את המידע הכללי שלו בהורדת הספר? בין כך ובין כך זה מוזר ביותר

    בעיות - תוכנת אוצריא

  • בירור | OCR לקבצי PDF לחיפוש בתוכנה
    1 11

    כן. העתקתי מהשכבה הפנימית טקסט כדי לדעת בוודאות שאני מחפש טקסט שקיים שם

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    את המידע התוכנה קוראת מתוך קובץ. או מתוך hebrew_books.csv או מ JSON כל שהוא שנוצר ממנו.
    הקובץ, יהיה אשר יהיה, לא נמחק והרשומות בו לא משתנות כשנוסף ספר לתיקיה, הפתיחה פשוט מדלגת על השלב הזה.

    בעיות - תוכנת אוצריא

  • הצעת ייעול | הגהה של ספרים באתר
    1 11

    @דוד-משה-1 כתב בהצעת ייעול | הגהה של ספרים באתר:

    אני אם הייתי מעלה לבינה זה אחרי OCR כלומר לעשות OCR ולהעלות לו תמונה ואת התוצאה

    הידע של ג'מיני לבצע OCR הוא עצום ביחס לתוכנות הישנות. כי הוא מזהה לכלולכים בדף וצורת הדף ולא רק מבנה אותיות.
    אחר כך הוא מזהה מבנה של אותיות.
    ורק בשלב השלישי הוא מתקן לפי דעתו הקלושה. אם תגדיר שהוא יעבוד לפי הסדר הזה בדיוק, תקבל תוצאות מקסימליות (ל-2026. בעוד שנה יהיה כבר יותר טוב)

    אתר 'ספריית אוצריא'

  • באג | פרטי ספר שיש PDF
    1 11

    א. אודה לתשובות עם קצת פחות גסות רוח. אנשים באים לכאן לסייע. וגם אם טעיתי במשהו ולא הבנתי את עומק הדברים.

    לגופו של ענין, כשאני בוחר ספר שאינו קיים אצלי אלא רק בהיברובוקס אני לוחץ ומקבל חלון כזה:

    image.png

    אם אכנס לאתר של היברובוקס ואורחד את הספר חן משה (לדוגמה, לדוגמה) אני לא אוכל יותר לקבל את המידע היכן הודפס ובאיזה שנה.

    אני יושב וחושב לבד מה ההבדל, ולמה כשאני מוריד את הPDF המידע הזה נעלם מהתוכנה והיא כבר לא יכולה לדעת אותו, יושב וחושב, חושב ויושב, יושב ויושב וחושב וחושב, ולא מצליח.
    אודה אם תעזור לי, אני לא מצליח לפענח לבד, וכבר נשחקו לי האונות לחלוטין.

    בעיות - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    כמו שהיא ידעה לפני 5 דקות לפני שהורדתי והכנסתי את הספר מהיברובוקס.

    בעיות - תוכנת אוצריא

  • בירור | OCR לקבצי PDF לחיפוש בתוכנה
    1 11

    אצלי זה לא עבד. לא בתיקיית היברובוקס ולא בתיקיה הרגילה של הקבצים

    בעיות - תוכנת אוצריא
  • התחברות

  • אין לך חשבון עדיין? הרשמה

  • התחברו או הירשמו כדי לחפש.
  • פוסט ראשון
    פוסט אחרון