[Hejes-devel] [1665] 'lagyszaruak' tipusu kivetelek kezelese (TODO: magyarazatok)

hejes-devel at nytud.hu hejes-devel at nytud.hu
Mon Oct 10 18:02:18 CEST 2016


Revision: 1665
Author:   mittelholcz
Date:     2016-10-10 18:02:17 +0200 (Mon, 10 Oct 2016)
Log Message:
-----------
'lagyszaruak' tipusu kivetelek kezelese (TODO: magyarazatok)

Modified Paths:
--------------
    trunk/web2py/applications/helyesiras_webdev/modules/egybekulon2.py

Added Paths:
-----------
    trunk/web2py/applications/helyesiras_webdev/modules/resources/egybekulon2_-_lagyszaruak

Modified: trunk/web2py/applications/helyesiras_webdev/modules/egybekulon2.py
===================================================================
--- trunk/web2py/applications/helyesiras_webdev/modules/egybekulon2.py	2016-10-06 12:33:12 UTC (rev 1664)
+++ trunk/web2py/applications/helyesiras_webdev/modules/egybekulon2.py	2016-10-10 16:02:17 UTC (rev 1665)
@@ -75,6 +75,9 @@
        dbconn: a web2py DAL object, an existing open connection to the MySQL database holding the lexical data.
     """
     self.dbconn = dbconn
+    with open('resources/egybekulon2_-_lagyszaruak') as file_:
+      self.literally_exceptions = set([ x.strip() for x in file_ ])
+      self.literally_exceptions = set([ unicode(x, 'utf8') for x in self.literally_exceptions if x and not x.startswith('#') ])
     pass
     
   @staticmethod
@@ -295,6 +298,19 @@
     try:
       sql = 'SELECT actual FROM `ohdict` WHERE norm IN ({0});'.format(','.join([escape_string(x) for x in norm_strings]))
       result = self.dbconn.executesql(sql, as_dict=True) # e.g. [{actual='alma fa'}, {actual='almafa'}]
+      #############################
+      # lagyszaruak
+      # TODO:
+      #   OK: a ragozott alakokra is mukodnie kellene (pl. 'lagyszaruaknak')
+      #   2. honnan jon a magyarazat? Azt is at kell irni, kulonben mas lesz a magyarazat, mint a javaslat.
+      #   OK: lehet, hogy nem kene minden result-ot atirni, ha tobb kulonbozo is van
+      ####
+      if any([x in ''.join(self.usrtoks) for x in self.literally_exceptions]):
+        for res in result:
+          if ' ' in res.get('actual', ''):
+            res['actual'] = res['actual'].replace(' ', '')
+      ####
+      ############################
     except:
       return False # return safely from any DB error
     # inverse of stemming + store

Added: trunk/web2py/applications/helyesiras_webdev/modules/resources/egybekulon2_-_lagyszaruak
===================================================================
--- trunk/web2py/applications/helyesiras_webdev/modules/resources/egybekulon2_-_lagyszaruak	                        (rev 0)
+++ trunk/web2py/applications/helyesiras_webdev/modules/resources/egybekulon2_-_lagyszaruak	2016-10-10 16:02:17 UTC (rev 1665)
@@ -0,0 +1,13 @@
+# egybekulon2_-_lagyszaruak
+#   Olyan szavakat tartalmaz, amiket toldalekok nelkul kulon kell irni,
+#   de toldalekokkal mar egybe. 
+#   Pelda: 'lagy szaru' kulon, de 'lagyszaruak' egybe.
+# Formatum:
+#   Egy sor - egy szo legyen.
+#   Ures sorok lehetnek.
+#   A sorok elejerol es vegerol a whitespace karakterek torlodnek.
+#   A '#' karakterrel kezdodo sorok kommentnek szamitanak. 
+lágyszárúak
+# lágyszárúság
+# széleskörűen
+




More information about the Hejes-devel mailing list