דילוג לתוכן
0
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • תרומות לאוצריא
  • צור קשר
  • דף הבית
  • חוקי הפורום
  • מדריכים
  • פוסטים אחרונים
  • לא נפתר
  • פופולרי
  • משתמשים
  • חיפוש בפורום
  • תרומות לאוצריא
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו אתר

פורום אוצריא

אוצריא - דף הבית
|
קח שותפות בהוספת ספרים
|
תרום לאוצריא חיפוש
  1. דף הבית
  2. הוספת ספרים לספריית אוצריא
  3. הצעת ייעול | אימון מודל לפיענוח טקסטים

הצעת ייעול | אימון מודל לפיענוח טקסטים

מתוזמן נעוץ נעול הועבר הוספת ספרים לספריית אוצריא
26 פוסטים 13 כותבים 249 צפיות 10 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • amramA מנותק
    amramA מנותק
    amram
    כתב נערך לאחרונה על ידי
    #1

    חשבתי על רעיון במקום שננסה לסמוך כל הזמן על אחרים
    כדאי נפתח מודל פינעוח טקסט מתמונה מתאים ללשון הקודש ולספרות הקודש
    והמודל יאומן על ידי המשתמשים היקרים
    כל משתמש יקבל קטע ויצטרך לתקן את הטעויות שלו וכך ילמד לאט לאט להשתפר
    במקום שכל משתמש יקבל להקליד חומר יצטרך לעבור על הפיענוח שלו ולתקן ואז כך המודל ילמד וישתפר ויתאים עצמו לספרות היהודית

    הבל הבליםה A 2 תגובות תגובה אחרונה
    0
    • amramA amram

      חשבתי על רעיון במקום שננסה לסמוך כל הזמן על אחרים
      כדאי נפתח מודל פינעוח טקסט מתמונה מתאים ללשון הקודש ולספרות הקודש
      והמודל יאומן על ידי המשתמשים היקרים
      כל משתמש יקבל קטע ויצטרך לתקן את הטעויות שלו וכך ילמד לאט לאט להשתפר
      במקום שכל משתמש יקבל להקליד חומר יצטרך לעבור על הפיענוח שלו ולתקן ואז כך המודל ילמד וישתפר ויתאים עצמו לספרות היהודית

      הבל הבליםה מנותק
      הבל הבליםה מנותק
      הבל הבלים
      צוות פיקוח
      כתב נערך לאחרונה על ידי
      #2

      @amram
      אתה יודע לעשות את זה?

      תגובה 1 תגובה אחרונה
      0
      • amramA מנותק
        amramA מנותק
        amram
        כתב נערך לאחרונה על ידי
        #3

        יש לי כיון אבל כמובן שצריך לעבוד על זה
        השאלה אם אתה לא חושב שזה יותר יעיל
        במקום שיצטרכו להקליד את הכל פשוט רק יתקנו וככה לאט לאט ילמד
        בעבר נתקלתי במשהו דומה רק של שמע לטקסט ובו משתמשים נרשמים ואז מאמנים אותו
        משמיעים להם קטע וטקסט ואז הם צריכים לאשר או לתקן וכך הוא לומד
        אצלנו אם נעשה כזה דבר הרווח יהיה כפול גם בסופו של יום הספר יהיה מוגה וגם המודל ילמד לאט לאט ופחות טעויות

        תגובה 1 תגובה אחרונה
        0
        • מ מנותק
          מ מנותק
          מישהו 1
          כתב נערך לאחרונה על ידי
          #4

          מהניסיון שלי פעם כשעבדתי עם גימני הייתי לבד מעתיק תמונות אליו ולאחמ"כ מתקן אותו ואומר לו מה האמת והוא ממש היה משתפר, אבל עדיין המודל של ווינדוס יותר טוב מההכי משופר של גימיני.
          רק בכתב רש"י שבזה באמת עדיין גימיני עדיין יותר טוב.

          איש גמזוא תגובה 1 תגובה אחרונה
          0
          • amramA amram

            חשבתי על רעיון במקום שננסה לסמוך כל הזמן על אחרים
            כדאי נפתח מודל פינעוח טקסט מתמונה מתאים ללשון הקודש ולספרות הקודש
            והמודל יאומן על ידי המשתמשים היקרים
            כל משתמש יקבל קטע ויצטרך לתקן את הטעויות שלו וכך ילמד לאט לאט להשתפר
            במקום שכל משתמש יקבל להקליד חומר יצטרך לעבור על הפיענוח שלו ולתקן ואז כך המודל ילמד וישתפר ויתאים עצמו לספרות היהודית

            A מנותק
            A מנותק
            arieldaniely
            כתב נערך לאחרונה על ידי
            #5

            @amram כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

            והמודל יאומן על ידי המשתמשים היקרים

            לאמן מאפס פחות פרקטי, אולי יהיה אפשר למצוא מודל קוד פתוח ולשפר אותו ע"י המשתמשים

            amramA תגובה 1 תגובה אחרונה
            0
            • A arieldaniely

              @amram כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

              והמודל יאומן על ידי המשתמשים היקרים

              לאמן מאפס פחות פרקטי, אולי יהיה אפשר למצוא מודל קוד פתוח ולשפר אותו ע"י המשתמשים

              amramA מנותק
              amramA מנותק
              amram
              כתב נערך לאחרונה על ידי
              #6

              @arieldaniely כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

              לאמן מאפס פחות פרקטי, אולי יהיה אפשר למצוא מודל קוד פתוח ולשפר אותו ע"י המשתמשים

              ברור שכדאי השאלה אם זה יהיה טוב מכיון שבעברית המודרנית שונה מהעברית הספרותית
              תראה לדוגמא יעקובוב פיתח משהו
              https://yakobov-dev.co.il/כלים/OcrChecker.aspx
              אפשר גם לבקש מדיקטה מה שיש להם לא רע בכלל ואז לאמן אותו

              A תגובה 1 תגובה אחרונה
              0
              • amramA amram

                @arieldaniely כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                לאמן מאפס פחות פרקטי, אולי יהיה אפשר למצוא מודל קוד פתוח ולשפר אותו ע"י המשתמשים

                ברור שכדאי השאלה אם זה יהיה טוב מכיון שבעברית המודרנית שונה מהעברית הספרותית
                תראה לדוגמא יעקובוב פיתח משהו
                https://yakobov-dev.co.il/כלים/OcrChecker.aspx
                אפשר גם לבקש מדיקטה מה שיש להם לא רע בכלל ואז לאמן אותו

                A מנותק
                A מנותק
                arieldaniely
                כתב נערך לאחרונה על ידי
                #7

                @amram כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                תראה לדוגמא יעקובוב פיתח משהו
                https://yakobov-dev.co.il/כלים/OcrChecker.aspx

                זה לא אותו הדבר, הוא פיתח זיהוי שגיאות, לא OCR, לאמן מודל זיהוי שגיאות זה דבר אחר לגמרי, למרות שזה יכול להיות רעיון טוב.

                תגובה 1 תגובה אחרונה
                0
                • amramA מנותק
                  amramA מנותק
                  amram
                  כתב נערך לאחרונה על ידי
                  #8

                  קודם צריכים לבחור מודל בקוד פתוח לסריקת טקסט הכי טוב ומתאים לנו משהו מבוסס AI ולא בשיטה הישנה של פעם
                  אחר כך הרעיון של האימון למודל זה בעיקר על ידי המשתמשים כל תיקון שלהם יעזור למודל לקלוט פעם הבאה את הטעויות כמובן שזה יהיה תלוי בפונטים בכתב רשי לדוגמא מסתבר שהטעויות יהיו אחרות
                  האימון שלנו זה רק להתאים אותו לשפה התלמודית

                  A תגובה 1 תגובה אחרונה
                  0
                  • דוד משה 1ד מנותק
                    דוד משה 1ד מנותק
                    דוד משה 1
                    מפתח
                    כתב נערך לאחרונה על ידי
                    #9

                    אם אתם מאוד רוצים אני התחלתי משהו כזה https://github.com/mosh-dvd/ocr-hebrew

                    amramA תגובה 1 תגובה אחרונה
                    1
                    • דוד משה 1ד דוד משה 1

                      אם אתם מאוד רוצים אני התחלתי משהו כזה https://github.com/mosh-dvd/ocr-hebrew

                      amramA מנותק
                      amramA מנותק
                      amram
                      כתב נערך לאחרונה על ידי
                      #10

                      @דוד-משה-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                      אם אתם מאוד רוצים אני התחלתי משהו כזה https://github.com/mosh-dvd/ocr-hebrew

                      האם זה נראה לך מתאים לפרוייקט שלנו?
                      אם תוכל קצת לפרט מה המעלות שלו
                      האם הוא מבוסס AI
                      איזה שיטה של סריקה ועיבוד הוא משתמש

                      תגובה 1 תגובה אחרונה
                      0
                      • דוד משה 1ד מנותק
                        דוד משה 1ד מנותק
                        דוד משה 1
                        מפתח
                        כתב נערך לאחרונה על ידי
                        #11

                        בניתי אותו מאפס אבל אין לי זמן לטפל בו הוא מסתבר צריך הרבה מאוד אימון וגם תיקון באגים

                        תגובה 1 תגובה אחרונה
                        1
                        • דוד משה 1ד מנותק
                          דוד משה 1ד מנותק
                          דוד משה 1
                          מפתח
                          כתב נערך לאחרונה על ידי
                          #12

                          אם כי הוא בנוי בשפת סף ....

                          תגובה 1 תגובה אחרונה
                          0
                          • amramA amram

                            קודם צריכים לבחור מודל בקוד פתוח לסריקת טקסט הכי טוב ומתאים לנו משהו מבוסס AI ולא בשיטה הישנה של פעם
                            אחר כך הרעיון של האימון למודל זה בעיקר על ידי המשתמשים כל תיקון שלהם יעזור למודל לקלוט פעם הבאה את הטעויות כמובן שזה יהיה תלוי בפונטים בכתב רשי לדוגמא מסתבר שהטעויות יהיו אחרות
                            האימון שלנו זה רק להתאים אותו לשפה התלמודית

                            A מנותק
                            A מנותק
                            arieldaniely
                            כתב נערך לאחרונה על ידי
                            #13

                            @דוד-משה-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                            צריך הרבה מאוד אימון וגם תיקון באגים

                            כמו שאמרתי... אולי כדאי ללכת בכיוון של https://yakobov-dev.co.il/כלים/OcrChecker.aspx שרק מתקן שגיאות, זה אמור להיות קל ומהיר יותר [ואולי אפילו לא יהיה צריך לאמן מודל אלא רק אלגוריתמים פשוטים שיתקנו שגיאות כתיב].

                            amramA תגובה 1 תגובה אחרונה
                            0
                            • A arieldaniely

                              @דוד-משה-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                              צריך הרבה מאוד אימון וגם תיקון באגים

                              כמו שאמרתי... אולי כדאי ללכת בכיוון של https://yakobov-dev.co.il/כלים/OcrChecker.aspx שרק מתקן שגיאות, זה אמור להיות קל ומהיר יותר [ואולי אפילו לא יהיה צריך לאמן מודל אלא רק אלגוריתמים פשוטים שיתקנו שגיאות כתיב].

                              amramA מנותק
                              amramA מנותק
                              amram
                              כתב נערך לאחרונה על ידי
                              #14

                              @arieldaniely כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                              כמו שאמרתי... אולי כדאי ללכת בכיוון של https://yakobov-dev.co.il/כלים/OcrChecker.aspx שרק מתקן שגיאות, זה אמור להיות קל ומהיר יותר [ואולי אפילו לא יהיה צריך לאמן מודל אלא רק אלגוריתמים פשוטים שיתקנו שגיאות כתיב].

                              אני מסכים שיותר קל רק תיקון שגיאות אבל בהשקעה לטווח ארוך עדיף נראלי לאמן מודל מבוסס AI
                              תחשוב שיש עשרות אלפי ספרי קודש וככל שהמודל יהיה יותר חכם ככה יחסוך עבודה בהמשך
                              אולי יהיה זמן שנוכל כבר להכניס ישירות מהמודל לתוכנה ללא צורך בהגהה

                              תגובה 1 תגובה אחרונה
                              0
                              • י. פל.י מנותק
                                י. פל.י מנותק
                                י. פל.
                                כתב נערך לאחרונה על ידי
                                #15

                                בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                                אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                                amramA תגובה 1 תגובה אחרונה
                                0
                                • י. פל.י י. פל.

                                  בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                                  אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                                  amramA מנותק
                                  amramA מנותק
                                  amram
                                  כתב נערך לאחרונה על ידי
                                  #16

                                  @י.-פל. כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                                  בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                                  אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                                  אם אתה אומר אתה יודע
                                  בכל אופן אפשר ללכת על ההצעה השניה לקחת מודל מוכן ורק לאמן בו את השיפור לשפה התלמודית

                                  ד תגובה 1 תגובה אחרונה
                                  0
                                  • amramA amram

                                    @י.-פל. כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                                    בשביל לאמן מודל, צריך המון דאטה, והמון ידע.
                                    אני לא חושב שהידע הצבר בכלל משתמשי הפורום הזה מספיק לכך.

                                    אם אתה אומר אתה יודע
                                    בכל אופן אפשר ללכת על ההצעה השניה לקחת מודל מוכן ורק לאמן בו את השיפור לשפה התלמודית

                                    ד מחובר
                                    ד מחובר
                                    דאנציג
                                    תורם לאוצריא
                                    כתב נערך לאחרונה על ידי
                                    #17

                                    @amram @י.-פל.
                                    נתקלתי בדיוק בסוף שבוע שעבר במודל של פרוייקט פנינים לOCR לכתב רש"י.
                                    אני עדיין לא הצלחתי להפעיל את התוכנה על כתב רש"י (חסר רכיבים שהורדתם חסומה בנטפרי - שלחתי בקשת פתיחה, אתמול ועדיין לא קיבלתי תשובה).

                                    תגובה 1 תגובה אחרונה
                                    0
                                    • ע"ה דכו"עע מנותק
                                      ע"ה דכו"עע מנותק
                                      ע"ה דכו"ע
                                      כתב נערך לאחרונה על ידי
                                      #18

                                      זה ס"ה מודל של tesseract שאומן על כתב רש"י, אבל המודל הזה מראש לא מספיק טוב.
                                      דווקא ניסיתי להכניס אותו לפחות לאופציה של הOCR הרגיל שבאתר ספריית אוצריא, שהוא גם כן עובד ע"י tesseract, אבל זה לא הצליח כנראה בגלל אי תאימות של הגירסאות

                                      amramA תגובה 1 תגובה אחרונה
                                      2
                                      • ע"ה דכו"עע ע"ה דכו"ע

                                        זה ס"ה מודל של tesseract שאומן על כתב רש"י, אבל המודל הזה מראש לא מספיק טוב.
                                        דווקא ניסיתי להכניס אותו לפחות לאופציה של הOCR הרגיל שבאתר ספריית אוצריא, שהוא גם כן עובד ע"י tesseract, אבל זה לא הצליח כנראה בגלל אי תאימות של הגירסאות

                                        amramA מנותק
                                        amramA מנותק
                                        amram
                                        כתב נערך לאחרונה על ידי
                                        #19

                                        @ע-ה-דכו-ע כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                                        זה ס"ה מודל של tesseract שאומן על כתב רש"י, אבל המודל הזה מראש לא מספיק טוב.
                                        דווקא ניסיתי להכניס אותו לפחות לאופציה של הOCR הרגיל שבאתר ספריית אוצריא, שהוא גם כן עובד ע"י tesseract, אבל זה לא הצליח כנראה בגלל אי תאימות של הגירסאות

                                        משום מה בספריה אצלי גם הגימיני וגם הOCR לא עובד לי כותב שגיאה

                                        ניסיתם לדבר עם דיקטה אולי יתנו לנו את המודל שלהם?

                                        חנניהח תגובה 1 תגובה אחרונה
                                        1
                                        • מ מישהו 1

                                          מהניסיון שלי פעם כשעבדתי עם גימני הייתי לבד מעתיק תמונות אליו ולאחמ"כ מתקן אותו ואומר לו מה האמת והוא ממש היה משתפר, אבל עדיין המודל של ווינדוס יותר טוב מההכי משופר של גימיני.
                                          רק בכתב רש"י שבזה באמת עדיין גימיני עדיין יותר טוב.

                                          איש גמזוא מחובר
                                          איש גמזוא מחובר
                                          איש גמזו
                                          כתב נערך לאחרונה על ידי
                                          #20

                                          @מישהו-1 כתב בהצעת ייעול | אימון מודל לפיענוח טקסטים:

                                          אבל עדיין המודל של ווינדוס יותר טוב מההכי משופר של גימיני.
                                          רק בכתב רש"י שבזה באמת עדיין גימיני עדיין יותר טוב.

                                          למעשה, מן הסתם רוב הספרים הרלוונטיים לשליפת הטקסט הם בכתב רש״י (ספרי היברו הישנים)

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון