KULANICI=os.path.expanduser("~")
BANKA=os.path.join(KULANICI,"BANKA_data")
BANKA_DATA=os.environ.get("BANKA_DATA",BANKA)
class TextManager(object):
GECERLI_EXT = None # uzeirne yazilir
BEKLEYEN_EXT = None # uzeirne yazilir
YER=None
def getir_dosyas(self, nedir):
return [x for x in os.listdir(get_dir(__file__) + self.YER) if x.endswith(nedir)]
@property
def gecerli_dosyas(self):
return self.getir_dosyas(self.GECERLI_EXT)
def algila_text(self, text):
corneks=[]
ctokens=[]
curr_ornek=None
onc_ornek=None
ornek_id=0
for idx, tk in enumerate(text):
t, olusturma=Token.get_or_create(idx, self, orjinalStr=tk)
if curr_ornek is None or t.baslangic_noktasi(onc_ornek):
curr_ornek, olusturma=Ornek.get_or_create(
ornek_id,
self,
parent=self
)
ornek_id +=1
corneks.append(curr_ornek)
curr_ornek.append(t)
ctokens.append(t)
onc_token=t
return corneks, ctokens
@property
def gecerli_dosyas(self):
return self.getir_dosyas(self.GECERLI_EXT)
@property
def bekleyen_dosyas(self):
return self.getir_dosyas(self.BEKLEYEN_EXT)
def yukle_gecerli_dosyas(self):
for f in self.gecerli_dosyas:
self._raw_content +=load_file(os.path.join(self.YER, f))
def tokenize(self, text):
return tokenize_text(text)
def loadme(self, banka, r=None):
p=os.path.join(BANKA_DATA, banka)
if os.path.exists(p):
print "Yukelendi.........", p
return p
else:
print "Belirtilen sistem klasor henuz olusturlmamis %s" % p
def yaz_corpus(self, anot_cumle, fn):
sep1="\t"
sep2="\n"
sep3="\n"
arsiv=open(fn, "a-")
for s in anot_cumle:#tagged_sents:
for w in s:
arsiv.write("%s" % w)
arsiv.write(sep3)
arsiv.close() text calismasi(python)
0
●767
- 26-08-2012, 12:13:15nlkt ile iilgili bir calsima yurutuyorum.verılen kod sıstemımızde belırtıcegımzı yerde belırtılen uzantılarda text dosyası olsuturmaya yarar