پایگاه داده های زبان فارسی

پایگاه داده های زبان فارسی به منظور ایجاد مجموعه ای بزرگ از پیکره های گوناگون زبان فارسی امروز طراحی شده است و در آن متن های برگزیده ادبی، علمی، هنری، سیاسی و مانند اینها از گونه های نوشتاری و گفتاری فارسی وجود دارد. این سامانه امکان جستجوی واژه ها، ترکیب ها ، باهمایی ها و بررسی بسامد آنها را به همراه گزارش های آماری متنوعی از متون فراهم می کند. افزون بر اصل متن ها و واژه های به کاررفته در آنها، معنی، مقوله دستوری، آوانگاشت و ریشه یا (بنواژه) بسیاری از واژه ها نیز در پایگاه وجود دارد.

توسط : fanniherfe ۱۳ آذر