דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • תרומות לאוצריא
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • תרומות לאוצריא
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
  1. דף הבית
  2. הוספת ספרים לספריית אוצריא
  3. הצעת ייעול | אימון מודל לפיענוח טקסטים

הצעת ייעול | אימון מודל לפיענוח טקסטים

מתוזמן נעוץ נעול הועבר הוספת ספרים לספריית אוצריא
26 פוסטים 13 כותבים 249 צפיות 10 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • amramA amram

    @arieldaniely כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

    לאמן מאפס פחות פרקטי, אולי יהיה אפשר למצוא מודל קוד פתוח ולשפר אותו ע"י המשתמשים

    ברור שכדאי השאלה אם זה יהיה טוב מכיון שבעברית המודרנית שונה מהעברית הספרותית
    תראה לדוגמא יעקובוב פיתח משהו
    https://yakobov-dev.co.il/כלים/OcrChecker.aspx
    אפשר גם לבקש מדיקטה מה שיש להם לא רע בכלל ואז לאמן אותו

    A מחובר
    A מחובר
    arieldaniely
    כתב נערך לאחרונה על ידי
    #7

    @amram כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

    תראה לדוגמא יעקובוב פיתח משהו
    https://yakobov-dev.co.il/כלים/OcrChecker.aspx

    זה לא אותו הדבר, הוא פיתח זיהוי שגיאות, לא OCR, לאמן מודל זיהוי שגיאות זה דבר אחר לגמרי, למרות שזה יכול להיות רעיון טוב.

    תגובה 1 תגובה אחרונה
    0
    • amramA מנותק
      amramA מנותק
      amram
      כתב נערך לאחרונה על ידי
      #8

      קודם צריכים לבחור מודל בקוד פתוח לסריקת טקסט הכי טוב ומתאים לנו משהו מבוסס AI ולא בשיטה הישנה של פעם
      אחר כך הרעיון של האימון למודל זה בעיקר על ידי המשתמשים כל תיקון שלהם יעזור למודל לקלוט פעם הבאה את הטעויות כמובן שזה יהיה תלוי בפונטים בכתב רשי לדוגמא מסתבר שהטעויות יהיו אחרות
      האימון שלנו זה רק להתאים אותו לשפה התלמודית

      A תגובה 1 תגובה אחרונה
      0
      • דוד משה 1ד מנותק
        דוד משה 1ד מנותק
        דוד משה 1
        מפתח
        כתב נערך לאחרונה על ידי
        #9

        אם אתם מאוד רוצים אני התחלתי משהו כזה https://github.com/mosh-dvd/ocr-hebrew

        amramA תגובה 1 תגובה אחרונה
        1
        • דוד משה 1ד דוד משה 1

          אם אתם מאוד רוצים אני התחלתי משהו כזה https://github.com/mosh-dvd/ocr-hebrew

          amramA מנותק
          amramA מנותק
          amram
          כתב נערך לאחרונה על ידי
          #10

          @דוד-משה-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

          אם אתם מאוד רוצים אני התחלתי משהו כזה https://github.com/mosh-dvd/ocr-hebrew

          האם זה נראה לך מתאים לפרוייקט שלנו?
          אם תוכל קצת לפרט מה המעלות שלו
          האם הוא מבוסס AI
          איזה שיטה של סריקה ועיבוד הוא משתמש

          תגובה 1 תגובה אחרונה
          0
          • דוד משה 1ד מנותק
            דוד משה 1ד מנותק
            דוד משה 1
            מפתח
            כתב נערך לאחרונה על ידי
            #11

            בניתי אותו מאפס אבל אין לי זמן לטפל בו הוא מסתבר צריך הרבה מאוד אימון וגם תיקון באגים

            תגובה 1 תגובה אחרונה
            1
            • דוד משה 1ד מנותק
              דוד משה 1ד מנותק
              דוד משה 1
              מפתח
              כתב נערך לאחרונה על ידי
              #12

              אם כי הוא בנוי בשפת סף ....

              תגובה 1 תגובה אחרונה
              0
              • amramA amram

                קודם צריכים לבחור מודל בקוד פתוח לסריקת טקסט הכי טוב ומתאים לנו משהו מבוסס AI ולא בשיטה הישנה של פעם
                אחר כך הרעיון של האימון למודל זה בעיקר על ידי המשתמשים כל תיקון שלהם יעזור למודל לקלוט פעם הבאה את הטעויות כמובן שזה יהיה תלוי בפונטים בכתב רשי לדוגמא מסתבר שהטעויות יהיו אחרות
                האימון שלנו זה רק להתאים אותו לשפה התלמודית

                A מחובר
                A מחובר
                arieldaniely
                כתב נערך לאחרונה על ידי
                #13

                @דוד-משה-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                צריך הרבה מאוד אימון וגם תיקון באגים

                כמו שאמרתי... אולי כדאי ללכת בכיוון של https://yakobov-dev.co.il/כלים/OcrChecker.aspx שרק מתקן שגיאות, זה אמור להיות קל ומהיר יותר [ואולי אפילו לא יהיה צריך לאמן מודל אלא רק אלגוריתמים פשוטים שיתקנו שגיאות כתיב].

                amramA תגובה 1 תגובה אחרונה
                0
                • A arieldaniely

                  @דוד-משה-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                  צריך הרבה מאוד אימון וגם תיקון באגים

                  כמו שאמרתי... אולי כדאי ללכת בכיוון של https://yakobov-dev.co.il/כלים/OcrChecker.aspx שרק מתקן שגיאות, זה אמור להיות קל ומהיר יותר [ואולי אפילו לא יהיה צריך לאמן מודל אלא רק אלגוריתמים פשוטים שיתקנו שגיאות כתיב].

                  amramA מנותק
                  amramA מנותק
                  amram
                  כתב נערך לאחרונה על ידי
                  #14

                  @arieldaniely כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                  כמו שאמרתי... אולי כדאי ללכת בכיוון של https://yakobov-dev.co.il/כלים/OcrChecker.aspx שרק מתקן שגיאות, זה אמור להיות קל ומהיר יותר [ואולי אפילו לא יהיה צריך לאמן מודל אלא רק אלגוריתמים פשוטים שיתקנו שגיאות כתיב].

                  אני מסכים שיותר קל רק תיקון שגיאות אבל בהשקעה לטווח ארוך עדיף נראלי לאמן מודל מבוסס AI
                  תחשוב שיש עשרות אלפי ספרי קודש וככל שהמודל יהיה יותר חכם ככה יחסוך עבודה בהמשך
                  אולי יהיה זמן שנוכל כבר להכניס ישירות מהמודל לתוכנה ללא צורך בהגהה

                  תגובה 1 תגובה אחרונה
                  0
                  • י. פל.י מנותק
                    י. פל.י מנותק
                    י. פל.
                    כתב נערך לאחרונה על ידי
                    #15

                    בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                    אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                    amramA תגובה 1 תגובה אחרונה
                    0
                    • י. פל.י י. פל.

                      בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                      אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                      amramA מנותק
                      amramA מנותק
                      amram
                      כתב נערך לאחרונה על ידי
                      #16

                      @י.-פל. כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                      בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                      אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                      אם אתה אומר אתה יודע
                      בכל אופן אפשר ללכת על ההצעה השניה לקחת מודל מוכן ורק לאמן בו את השיפור לשפה התלמודית

                      ד תגובה 1 תגובה אחרונה
                      0
                      • amramA amram

                        @י.-פל. כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                        בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                        אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                        אם אתה אומר אתה יודע
                        בכל אופן אפשר ללכת על ההצעה השניה לקחת מודל מוכן ורק לאמן בו את השיפור לשפה התלמודית

                        ד מנותק
                        ד מנותק
                        דאנציג
                        תורם לאוצריא
                        כתב נערך לאחרונה על ידי
                        #17

                        @amram @י.-פל.
                        נתקלתי בדיוק בסוף שבוע שעבר במודל של פרוייקט פנינים לOCR לכתב רש"י.
                        אני עדיין לא הצלחתי להפעיל את התוכנה על כתב רש"י (חסר רכיבים שהורדתם חסומה בנטפרי - שלחתי בקשת פתיחה, אתמול ועדיין לא קיבלתי תשובה).

                        תגובה 1 תגובה אחרונה
                        0
                        • ע"ה דכו"עע מנותק
                          ע"ה דכו"עע מנותק
                          ע"ה דכו"ע
                          כתב נערך לאחרונה על ידי
                          #18

                          זה ס"ה מודל של tesseract שאומן על כתב רש"י, אבל המודל הזה מראש לא מספיק טוב.
                          דווקא ניסיתי להכניס אותו לפחות לאופציה של הOCR הרגיל שבאתר ספריית אוצריא, שהוא גם כן עובד ע"י tesseract, אבל זה לא הצליח כנראה בגלל אי תאימות של הגירסאות

                          amramA תגובה 1 תגובה אחרונה
                          2
                          • ע"ה דכו"עע ע"ה דכו"ע

                            זה ס"ה מודל של tesseract שאומן על כתב רש"י, אבל המודל הזה מראש לא מספיק טוב.
                            דווקא ניסיתי להכניס אותו לפחות לאופציה של הOCR הרגיל שבאתר ספריית אוצריא, שהוא גם כן עובד ע"י tesseract, אבל זה לא הצליח כנראה בגלל אי תאימות של הגירסאות

                            amramA מנותק
                            amramA מנותק
                            amram
                            כתב נערך לאחרונה על ידי
                            #19

                            @ע-ה-דכו-ע כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                            זה ס"ה מודל של tesseract שאומן על כתב רש"י, אבל המודל הזה מראש לא מספיק טוב.
                            דווקא ניסיתי להכניס אותו לפחות לאופציה של הOCR הרגיל שבאתר ספריית אוצריא, שהוא גם כן עובד ע"י tesseract, אבל זה לא הצליח כנראה בגלל אי תאימות של הגירסאות

                            משום מה בספריה אצלי גם הגימיני וגם הOCR לא עובד לי כותב שגיאה

                            ניסיתם לדבר עם דיקטה אולי יתנו לנו את המודל שלהם?

                            חנניהח תגובה 1 תגובה אחרונה
                            1
                            • מ מישהו 1

                              מהניסיון שלי פעם כשעבדתי עם גימני הייתי לבד מעתיק תמונות אליו ולאחמ"כ מתקן אותו ואומר לו מה האמת והוא ממש היה משתפר, אבל עדיין המודל של ווינדוס יותר טוב מההכי משופר של גימיני.
                              רק בכתב רש"י שבזה באמת עדיין גימיני עדיין יותר טוב.

                              איש גמזוא מנותק
                              איש גמזוא מנותק
                              איש גמזו
                              כתב נערך לאחרונה על ידי
                              #20

                              @מישהו-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                              אבל עדיין המודל של ווינדוס יותר טוב מההכי משופר של גימיני.
                              רק בכתב רש"י שבזה באמת עדיין גימיני עדיין יותר טוב.

                              למעשה, מן הסתם רוב הספרים הרלוונטיים לשליפת הטקסט הם בכתב רש״י (ספרי היברו הישנים)

                              תגובה 1 תגובה אחרונה
                              0
                              • אהרןא מנותק
                                אהרןא מנותק
                                אהרן
                                כתב נערך לאחרונה על ידי
                                #21

                                האמת שבעבר פיתחתי תוכנה כזאת שמחליפה כמה מילים בבת אחת, ורשמתי לעצמי את כל הטעויות הנפוצות, וכך ע"י טעינת הקובץ עם ההחלפות זה היה מחליף את הכל. רק היה הרבה באגים ואין לי זמן לטפל בזה.

                                תגובה 1 תגובה אחרונה
                                1
                                • amramA amram

                                  @ע-ה-דכו-ע כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                                  זה ס"ה מודל של tesseract שאומן על כתב רש"י, אבל המודל הזה מראש לא מספיק טוב.
                                  דווקא ניסיתי להכניס אותו לפחות לאופציה של הOCR הרגיל שבאתר ספריית אוצריא, שהוא גם כן עובד ע"י tesseract, אבל זה לא הצליח כנראה בגלל אי תאימות של הגירסאות

                                  משום מה בספריה אצלי גם הגימיני וגם הOCR לא עובד לי כותב שגיאה

                                  ניסיתם לדבר עם דיקטה אולי יתנו לנו את המודל שלהם?

                                  חנניהח מנותק
                                  חנניהח מנותק
                                  חנניה
                                  כתב נערך לאחרונה על ידי חנניה
                                  #22

                                  @amram
                                  אם כבר,
                                  למה לא להתנדב לדיקטה וא"כ להתאים את הספרים שלהם?

                                  ואגב, אולי כדאי לשאול את @11 או את המומחה שלו לעניני סטיסטיקה ותוכן מה יצא עם זה..

                                  amramA תגובה 1 תגובה אחרונה
                                  0
                                  • חנניהח חנניה

                                    @amram
                                    אם כבר,
                                    למה לא להתנדב לדיקטה וא"כ להתאים את הספרים שלהם?

                                    ואגב, אולי כדאי לשאול את @11 או את המומחה שלו לעניני סטיסטיקה ותוכן מה יצא עם זה..

                                    amramA מנותק
                                    amramA מנותק
                                    amram
                                    כתב נערך לאחרונה על ידי
                                    #23

                                    @חנניה כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                                    @amram
                                    אם כבר,
                                    למה לא להתנדב לדיקטה וא"כ להתאים את הספרים שלהם?

                                    אם אני אתנדב לדיקטה זה לא כל כך יעזור אחד לפה אחד לשם
                                    אם נצליח להכניס את מנוע הסריקה שלהם לספריה
                                    אז יעזור לכל העורכים יש כמה מאות אתה מבין שזה עולם אחר להקליד לבין לסרוק ויעבוד עם מודל חכם וכן מודל שפה שיתן תוצאות טובות כמו של דיקטה ורק העורך מתקן פה ושם

                                    תגובה 1 תגובה אחרונה
                                    0
                                    • זאב לבןז מחובר
                                      זאב לבןז מחובר
                                      זאב לבן
                                      כתב נערך לאחרונה על ידי
                                      #24

                                      איך למעשה דיקטה מצליחה גם על ספרים ישנים ואותיות שבורות?

                                      amramA תגובה 1 תגובה אחרונה
                                      0
                                      • זאב לבןז זאב לבן

                                        איך למעשה דיקטה מצליחה גם על ספרים ישנים ואותיות שבורות?

                                        amramA מנותק
                                        amramA מנותק
                                        amram
                                        כתב נערך לאחרונה על ידי
                                        #25

                                        @זאב-לבן כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                                        איך למעשה דיקטה מצליחה גם על ספרים ישנים ואותיות שבורות?

                                        תשאל אותם
                                        אתה יכול לראות כאן שהם מסבירים קצת אבל לא מגלים בדיוק איך הם עובדים
                                        https://jewishaction.com/cover-story/artificial-intelligence-the-newest-revolution-in-torah-study/

                                        תגובה 1 תגובה אחרונה
                                        1
                                        • יהודי צעירי מנותק
                                          יהודי צעירי מנותק
                                          יהודי צעיר
                                          עורך ספרים מקצועי
                                          כתב נערך לאחרונה על ידי יהודי צעיר
                                          #26

                                          ביקשתי מדיקטה מזמן שאני מוכן להתנדב ולעבוד אצלם בחינם
                                          והם הודו לי, ואמרו שרשמו את זה, ואם יהיה צורך יפנו אלי...

                                          תגובה 1 תגובה אחרונה
                                          1

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון