דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
1

11

@11
אודות
פוסטים
57
נושאים
9
שיתופים
0
קבוצות
0
עוקבים
0
עוקב אחרי
0

פוסטים

פוסטים אחרונים הגבוה ביותר שנוי במחלוקת

  • הצעת ייעול | הגהה של ספרים באתר
    1 11

    שוחחתי הבוקר בארוכה עם המומחה שלי לענייני סטטיסטיקה ותוכן.
    מה שיצא לנו זה זה רעיון בערך כזה (מקווה לנסות ליישם בקרוב):

    1. לקחת מאגר ספרים גדול מאוד של סריקות, כמו לדוגמה היברובוקס, ולהריץ מודל ocr, אבל להכניס ממנו רק את התוצאות שמוגדרות בסריקה כרמת וודאות של 95 אחוז ומעלה (רוב כלי הOCR גם כותבים רמת וודאות).
    2. המילים הנ"ל נכנסות למאגר מילוני, וכעת התוכנה מחפשת מילים שאינן במילון שיכולות להכנס בעזרת החלפת אות אחת (אולי עדיף בשלב ראשון רק החלפת אותיות דומות בעברית, כמו ה' וח' או ב' וכ').
    3. המילון מחליף את התמונה, ובו זמנית מזהה שמהיום תמונה של בראשיח היא בעצם בראשית, וזה נכנס לרמת וודאות גבוהה ונוסף למילון כבראשית.
    4. בכל הרצה נוספים מילים נוספות למילון, בשעה שמילה שאינה קיימת בעברית/לשה"ק לא תוכל להכנס אלא אם היא ברמת וודאות של 100 אחוז.
    5. הרצה נוספת שצריך לשקול באיזה שלב, לקחת קורפוס כזה או אחר (יש כמה חינמיים), ולהוסיף למילון לאחר שמיצינו את הבעיות. (בו זמנית כל קורפוס מכיל סטטיסטיקות של סבירות תדירות אותיות, צריך לשקול שימוש בזה).
    6. הרצה נוספת שצריך לשקול באיזה שלב, חיפוש רצף מילים, נניח 10 מילים זהות שנמצאות במקום אחר בשינוי אות אחת, שיבנה לפי סטטיסטיקות. אחר כך יורד ל9 וכן הלאה.

    כל זה נשמע מסובך מאוד, כי זה מסובך מאוד, אבל כבר אמר הגר"א שהעקשן יצליח, ואני מתכוון בעז"ה להתעקש.
    הבעיה הגדולה כאן היא שכל טעות בתכנון עלולה לעלות ביוקר רב. ולכן אשמח לכל משוב ותוספת רעיונות וכו'.

    אתר 'ספריית אוצריא'

  • הצעת ייעול | כמה שיפורים שאני ממליץ בחום רב
    1 11

    תרשו לי גם לסכם את השיחה שלי עם @י.-פל. בקצרה. (כותב כאן מזכרון, והזיכרון שלי קצת חלוד).
    הפורמט הנכון לדעתי, הוא כעין מה שעושים באוצר החכמה. באותו מסך יש שורת חיפוש ורשימת ספרים (אפשר בקלות גם להוסיף טאב שיסתיר את הרשימה בעת עיון בספר) ליד זה רשימת תגיות (כמו בתמונה ששלחתי כאן בתחילה) שמאפשרת להגיע למיקום ספציפי בספר בלי לפתוח רשימה ולגלול את המקלדת עד שהמפרק של הזרוע חורק, ובקיצור הכל במסך אחד. כל העולם עובר לכמה שפחות מסכים, ולא בהכרח שכולם טועים.
    איך אני יודע? כי חווית השימוש שלי לא נעימה, אני לא טכנופוב גדול, ושמח ואוהב לבחון תוכנות עד למעמקי הקישקעס שלהם, ועדיין הסתבכתי, וגם עכשיו שאני יודע מה קורה זה בעיני הזוי.
    לדעתי כאן זורעים וחורשים וקוצרים, ולשים ומעמרים, ומחפשים מתכון, וכו' וכו', אבל בסוף וכו' וכו'. המשל מובן.

    לגבי מה ש@י.-פל. מכנה שלא בדקדוק מודל rag, יקרא לזה איך שיקרא לזה, בניתי לעצמי מודל שיתן לי תוצאות של בינה מלאכותית, לצורך עצמי. וכיון שבניתי את זה לצורך עצמי היו כאן כמה בעיות.

    1. אני לא יכול לשתף באינדקס הזה כמו שהוא כי הכנסתי לשם כל מיני קבצים אישיים, ואין לי ענין שבכל חיפוש באוצריא ימצאו את הבעיות שלי.
    2. האופן שבו בניתי את זה היה אופן מאוד לא חכם, ולכן למרות שבניתי כבר, לו היה לי כח הייתי יוצא אל השוק ובונה חדש. לוקח למחשב ממוצע לבנות אינדקס כזה כמה ימים, ואם טעיתי הכל יורד לטמיון. איי... מה בעלי המוסר היו עושים עם דוגמה כזו...
    3. ב2 מילים (מה ששכחתי להסביר בטלפון וכדאי לחשוב על זה היטב לפני שמתחילים) בניית אינדקס כרוכה מגזירת המידע לחתיכות קטנות, ועקטארים בלע"ז, וסידורו. אלא מאי? שאני חתכתי באופן סיסטמטי כל 500 מילים, עם חזרה של 100 (כך אם זוכר נכון, יתכן שמשהו אחר, אבל שלחתי לך את הקוד השלם פרוש כשמלה על פני המייל בדוק שם), אבל זו טעות נוראה ביותר, כי כיון שיש כבר תגיות של סעיפים וסימנים וכו', הרי שעדיף שלושים מונים לעשות חיתוך לפי זה, וזה ידייק את התוצאות הרבה יותר. מה גם שאפשר לשלב בין שניהם ולבנות אינדקס כפול (שאמנם יתפוס כך וכך ג'יגות אבל יהיה מדוייק בהרבה).

    ולגבי אתר אינטרנט.
    היתרון באתר הוא המהירות והאכסון והפונקציונליות.
    המהירות - לא קריטית במיוחד, גם אם יש לכם מחשב יד שניה, אין הפרש גדול במהירות ההפעלה, אבל תיקונים ועדכונים וכו' לא מתעדכנים אוטומטית.
    האכסון - אם רוצים גם מנוע בינה מלאכותית - זה תופס נפח של פי 2 מהנפח הקיים כיום. לפחות. ואם רוצים משהו יעיל מאוד אז יותר. ואם רוצים להוסיף ספרי PDF למיניהם ועוד דברים שתוספים נפח, אין מקום במחשב. (ושוב חוזרים לבעלי המוסר: אם מכניסים לראש וכו' לא נשאר מקום בראש וכו').
    הפונקציונליות - אין אפשרות לחיפושים כמו בגוגל בוקס או באתרים אחרים. אין אפשרות לתקן ספרים אוטומטית לכולם וכן הלאה.

    אבל מה? יש עדיין כמה אנשים שאין להם גישה לאינטרנט אשרי חלקם בזה ובבא (שוב הגענו לבעלי המוסר? מה קורה היום?),
    בשביל זה יש פתרון מאוד פשוט, מה שעושים בכל העולם בכאלו מצבים. בונים תוכנה משולבת. כלומר, תוכנה שתעבוד באופן מושלם ונפלא ומדהים אבל כשתתחבר לאינטרנט יהיו לזה עוד פונקציות, אם לא תתחבר לא יהיה. בדיוק כמו שאתה לא יכול לעדכן את התוכנה בלי חיבור. והאופן הנח לבנות כזה דבר הוא במסך HTML פשוט ולחפש בדפדפן.

    חייב לרוץ כי הראש כולל דוחק, אבל ארחיב לפי הצורך אם וכאשר.

    הצעות לשיפור - תוכנת אוצריא

  • הצעת ייעול | כמה שיפורים שאני ממליץ בחום רב
    1 11

    זה מורכב מכדי לענות בכן ולא. אבל אם חייבים להגיע לכן ולא אז - יש אופציה חינמית או זולה מאוד.
    יש לי לדוגמה מערכת של בינה מלאכותית, שמאפשרת לעשות חיפוש באוצריא ולקבל תוצאות של בינה מלאכותית, כלומר, אתה יכול לשאול מה מברכים על גזר ולקבל תשובה, או מה לעשות אם שכחתי להתפלל וכדומה. מצרף תמונה לדוגמה.

    image.png

    image.png

    הצעות לשיפור - תוכנת אוצריא

  • המלצה | רשימה שמית ולא בתיקיות
    1 11

    @י.-פל. כתב בהמלצה | רשימה שמית ולא בתיקיות:

    1. אתה יכול לעשות pull, כל תרומת קוד תתקבל בברכה - אם כי לא בטוח שבהצלחה...

    ענין עקרוני. כמו שאתה רוצה להוציא את האינטרנט מהבית, אני רוצה להוציא את התכנות מהראש. לו ידעתי כמה מיליארדי שעות השקעתי בכל מיני פרוייקטים טובים ופרוייקטים מטופשים, היית מבין למה אני עושה לעצמי סייגים כאלו ואחרים. אל נא באפך.

    1. אני מנסה להבין: מה נותנת לך רשימת שמות - יותר מאשר חיפוש? הלא אתה לא הולך לדפדף ב7,500 כותרים...

    פעמים רבות כן. כגון: אני רוצה להגיד משהו על פרשת השבוע ליד השולחן כמנהג בעלי בתים חשובים, ואני רוצה כעת את רשימת הספרים המלאה של הקטגוריה. לי זה קורה הרבה דברים מעין זה.

    1. לגבי:

    @11 כתב בהמלצה | רשימה שמית ולא בתיקיות:

    את השורה בצד ימין של המודולים להעביר לסמלים למעלה

    כוונתך ללוח השנה?

    לא. כוונתי לכל מה שיש בצד ימין, שזה עין ואיתור וחיפוש וכדומה. אם הסרגל הימני לא יהיה שם, ורשימת הספרים תתכווץ, נשאר חלק מהותי מהמסך לקרוא את הספר.

    @11 כתב בהמלצה | רשימה שמית ולא בתיקיות:

    אפשר לשלב אותם במודול אחד חכם יותר

    אני אשמח להסבר יותר מפורט.

    אסביר.

    1. המודול של איתור הוא זהה למודול של שם ספר עם תוספת פיצ'ר של איתור מדוייק בתוך הספר. אפשר לבטל אותו ולהוסיף את זה לחיפוש ברשימת הספרים שאם אני כותב שמות הוא מראה לי את חומש שמות ואם אני ממשיך לכתוב שמות יא יג הוא ימצא לי את הפסוק ישירות.
      אפשרות שניה, ליד החלונית של שם הספר להוסיף חלונית קטנה לכתיבת המקור המדוייק באותו הספר (עם מעבר באמצעות טאב, כדי לא לעזוב המקלדת). וזה חוזר גם למה שהצעתי בעבר לעשות טור/עמודה של הגעה למקור המדוייק ישירות.
    2. המודול של ספריה ושל עיון הם זהים ומכפילים את עצמם כאשר משתמשים בתצוגה מקדימה. אפשר לבטל את מצב עיון ושיהיה תמיד בתצוגה מקדימה, ולהעביר לשם את הפונקציה של הכרטיסיות.
    3. חיפוש בתוכן הספרים הוא בחלון נפתח בפני עצמו. אפשר במקום זה להוסיף בדף הבית שורה שזה תפקידה.
      כל זה בעצם הופך את התוכנה לדף אחד בודד עם כל הפונקציות. (כמו שבאוצר החכמה עשו אחרי ניסיונות רבים, והם בעצם עברו את כל הדרך שלנו, אז למה לא לקצר ולהגיע למסקנות ישירות).
    4. ההגדרות נפתחות בחלון נפרד. גם זה מכביד. היה כדאי להשתמש בחלון התצוגה לכל דבר, וכשולחצים על הגלגל שיניים (או להחליף את זה לתמונה של קונגו, כי זה המון הגדרות ולא רק בודדות) זה יפתח בחלון התצוגה את רשימת ההגדרות. כנ"ל האודות והתודות.

    אגב, ממש אתמול נזכרתי בך, והחלפתי את הקישור להיברובוקס - במה שהצעת.

    בדיוק ראיתי את זה, ובדיוק רציתי לפתוח לך אשכול של תודות פרחים ונשיקות, אבל הקדמתני. יהי רצון שתעלה לפניך המחשבה למעשה.

    הצעות לשיפור - תוכנת אוצריא

  • באג | פרטי ספר שיש PDF
    1 11

    image.png

    מי גילה לאוצריא שיש לי את הספר בית יהודה? זה מובנה. כשיש לי אותו זה מזוהה לבד דרך האינדקס.

    בעיות - תוכנת אוצריא

  • הצעת ייעול | הגהה של ספרים באתר
    1 11

    @דוד-משה-1 כתב בהצעת ייעול | הגהה של ספרים באתר:

    אני אם הייתי מעלה לבינה זה אחרי OCR כלומר לעשות OCR ולהעלות לו תמונה ואת התוצאה

    הידע של ג'מיני לבצע OCR הוא עצום ביחס לתוכנות הישנות. כי הוא מזהה לכלולכים בדף וצורת הדף ולא רק מבנה אותיות.
    אחר כך הוא מזהה מבנה של אותיות.
    ורק בשלב השלישי הוא מתקן לפי דעתו הקלושה. אם תגדיר שהוא יעבוד לפי הסדר הזה בדיוק, תקבל תוצאות מקסימליות (ל-2026. בעוד שנה יהיה כבר יותר טוב)

    אתר 'ספריית אוצריא'

  • הצעת ייעול | כמה שיפורים שאני ממליץ בחום רב
    1 11

    e49daabc-4df9-463c-9758-cf2355cee06f-image.png

    ככה אני מדמיין את אוצריא בצורה יעילה.
    בצד ימין רשימת הספרים, ליד זה רשימת תגים להגיע מהר לכל ספר, לבצד שמאל התצוגה המלאה של הספר.
    חסר לי מאוד כפתור איפוס של הכל, להגיע למצב בסיס (כפי שהגדרתי אותו בגודל פונים ומצבים והכל, אבל שיסגור הכל לגמרי).
    לדעתי העניה, איתור וחיפוש ועיון והכל צריך לבוא במסך אחד דומה לתמונה ששלחתי, זה הרבה יותר נח והרבה יותר יעיל, וכך בכל התוכנות הקיימות, ולא לחלק למודולים שונים שכל אחד יש לו מצב צבירה שונה.

    הצעות לשיפור - תוכנת אוצריא

  • הצעת ייעול | הגהה של ספרים באתר
    1 11

    יש בזה הבדל מאוד מהותי אם אתה מעוניין בPDF עם תוצאה או שאתה מעוניין בטקסט. כי אם אתה מעוניין בחיפוש סטייל אוצר החכמה שתמצא בתוך הPDF אפשר במקביל להריץ כמה וכמה סריקות OCR, מכמה ספריות קיימות שעושות את זה בצורות שונות זו מזו.
    ואמנם PDF בנוי לשכת טקסט אחת, אבל אפשר במקביל להריץ חיפוש תמיד בקובץ טקסט שיזהה את המיקום (בניתי מעין כלי כזה בעבר כך שאני יודע שזה אפשרי, וחבל על דאבדין). יש כמה ספריות חינמיות של OCR, ולענ"ד אין צורך בכלל להשתמש מעבר לזה, כי פענוח מקביל של 3-4 ספריות, יתן תוצאות ברמה מאוד גבוהה.
    מצד שני, אם רוצים לייצר טקסט מבלי לצפות בדף החיפוש, אין ברירה אלא לבחור טקסט אחד, ואז נתקלים במחסום.

    אתר 'ספריית אוצריא'

  • הצעת ייעול | כמה שיפורים שאני ממליץ בחום רב
    1 11

    עוד משהו שאפשר רק באתר, חיפוש דומה לאוצר החכמה בספרי גוגלבוקס

    image.png

    הצעות לשיפור - תוכנת אוצריא

  • הצעת ייעול | כמה שיפורים שאני ממליץ בחום רב
    1 11

    עוד דבר לשיפור חשוב מאוד:
    בקישור ספרים להיברו בוקס, לא להכניס קישור לעמוד הבית של הספר, אלא לעמוד הראשון של הספר בקריאה מקוונת. לחשוב לכל משתמש את המעבר הנוסף המיותר עבורו.

    הצעות לשיפור - תוכנת אוצריא

  • מאגר ספרים חינמיים pdf
    1 11

    יש מאגרי ספרים חינמים עצומים, כמו בהיברובוקס ובספריה הלאומית ועוד.
    מנסה לחשוב על מודל שבו לא כל אחד יצטרך להוריד לבדו כל ספר שהוא רוצה, אלא מאגר כל שהוא קבוע שכל מי שימצא ספר חדש שאינו נמצא באוצריא וקיים להורדה חינם בלי בעיה של זכויות יוצרים, יוכל לעדכן שם.
    אפשר ליצור מאגר כזה די בקלות, וליצור קובץ שיזהה איזה ספרים נוספו ויעדכן משם, ניתן אפילו בגוגל דרייב להניח מאגר כזה, או במקומות רבים נוספים.
    האם יש ביקוש, והאם ידוע משהו על זכויות יוצרים?
    ואודה לעוד רעיונות לשיפור דבר כזה.

    הצעות לשיפור - תוכנת אוצריא

  • הצעת ייעול | כמה שיפורים שאני ממליץ בחום רב
    1 11

    אין שום סתירה בין הדברים. תוכנה יכולה להיות לא מקוונת, עם פונקציות נוספות למי שמקוון.
    גם כיום באוצראי הפונקציה של הוספת ספרים חדשים היא מקוונת בלבד בלית ברירה

    הצעות לשיפור - תוכנת אוצריא

  • המלצה | רשימה שמית ולא בתיקיות
    1 11

    @י.-פל. כתב בהמלצה | רשימה שמית ולא בתיקיות:

    יש לך בעיה בסיסית, הנקראצ: אין העשיר מכיר בצערו של העני.
    אתה פשוט מעולםלא התעסקת עם פחות מ4 מסכים, ומסכי 13 אינצ'.

    אני מודה שאני משתמש במסכים גדולים. אבל גם זה פתיר. ולא צריך לפתח תוכנה לעשירים ותוכנה לעניים, מספיק לעשות חץ קטן מעל הרשימה שתפקידו להסיט אותה ימינה (כלומר בפועל להסתיר אותה מהמסך). עושים זאת בתוכנות רבות.
    נ.ב. לא משוכנע שמנהל הבנק שלי יסכים עם ההכללה שלי ברשימת העשירים.

    הצעות לשיפור - תוכנת אוצריא
  • התחברות

  • אין לך חשבון עדיין? הרשמה

  • התחברו או הירשמו כדי לחפש.
  • פוסט ראשון
    פוסט אחרון