39 – පාඨ සැකසුම් උපාංග (text processing utilities) (1 කොටස)

Linux හි සියලු සැකසීම් පාඨ ගොණු (text files) තුළ පමණක් තබාගන්නා නිසා වෙනත් මෙහෙයුම් පද්ධති (operating systems) මෙන් තොරතුරු සැඟවී නොපවතී. මේ නිසාම text files සමග ඉතා පහසුවෙන් කටයුතු කිරීමට සහ පාඨ සැකසුම් (text processing) සිදුකිරීමට අවශ්‍ය උපාංග (utilities) ගණනාවක් විධාන පෙළ (command line) හි අඩංගු වේ. මෙම utilities හරහා text files වල අපට අවශ්‍ය සංස්කරණ (editing) කටයුතු ද ඉතා පහසුවෙන් ඉටුකරගත හැකිය. අදින් ඇරඹෙන ලිපි කිහිපය මගින් text processing utilities පිලිබඳ සොයා බලමු. මෙහිදී අප සොයා බලනු ලබන්නේ පාඨ ගොණු සංස්කරණය (text file editing) නොව text files හි අන්තර්ගතය අපට අවශ්‍ය පරිදි සැකසීමේ (processing) උපක්‍රම පිළිබඳවයි. Text file editing පිළිබඳව පෙර ලිපි මගින් සාකච්ඡා කර ඇත.

cat

Text file වල අන්තර්ගතය බලාගැනීමට යොදාගනී. -A විකල්පය (option) යෙදීමෙන් මුද්‍රණය නොවන (non-printable) විශේෂිත සංකේත (symbols) ද පෙන්වයි. (^I මගින් Tab කිරීම ද $ මගින් ද නිරූපණය වේ). -n option යෙදීමෙන් පේළි අංක දැකගත හැකි අතර අන්තර්ගතය පෙන්වීමේදී හිස් පේළි කිහිපයක් එකක් ලෙස දැක්වීමට -s option යොදාගනී. cat command හරහා අලුතින් text files නිර්මාණය කරන ආකාරය “ආදාන/ප්‍රතිදාන ගමනාන්තය වෙනස් කිරීම” ලිපියේ පළවිය.

cat-command-usage
cat command usage

sort

sort command මගින් එයට ලබාදෙන ආදානය (input) ආරෝහණ (ascending) හෝ අවරෝහණ (descending) පිළිවෙලට සකස් කිරීම සිදු කරයි. Input ලෙස file එකක්, keyboard හරහා type කරන දෑ හෝ වෙනත් command එකක ප්‍රතිදානය (output) යොදාගත හැකිය. මෙහිදී සම්මතය ලෙස සියල්ල අකුරු (text) ලෙස සලකා ascending order එකට පෙළගැස්වීම සිදු කරයි. මේ නිසා අංක ඇතුළත් කිරීමේදී ඒවායේ අගයන් නොව ඉලක්කම් වල සාමාන්‍ය පිළිවෙල (0-9) පමණක් සලකා බලනු ලැබේ.

sort-kb-input

Input ලෙස files කිහිපයක් වුවද ලබාදිය හැකි නිසා එම files සියල්ල එකවර sort කර තනි file එකක් සාදා ගැනීමට ප්‍රයෝජනවත් වේ.

sort-multiple-files
sort multiple files

sort command හි options (විකල්ප) කිහිපයක් පහතින් දැක්වේ.

-b - පේළිය ආරම්භයේ ඇති හිස්තැන් (spaces) නොසලකා sort කිරීම සිදු කරයි.
-f - අකුරු වල uppercase/lowercase භේදය නොසලකා හරියි.
-n - ඉලක්කම් වල අගය sort කිරීමට යොදාගනී.
-r - descending order එකට sort කිරීම සිදු කරයි.

sort කිරීමේදී පේළි සියල්ල වගුවක ඇති වචන සමුහයක් ලෙස අනුමාන කර පළමු තීරුව (column) පළමු වචනය ලෙස සලකා sort කිරීම සිදුවේ. අවශ්‍ය නම් වෙනත් තීරුවකට අනුව sort කිරීම සිදුකල හැකිය. ඒ සඳහා -k option සමග තීරු අංකය (column number) ලබාදෙන්න.

sort-from-other-col
sort by another column

මෙහිදී columns වෙන් කිරීමට (delimiter) සම්මතය ලෙස හිස්තැන් (space) අනුමාන කර ඇති බැවින් වෙනත් සංකේතයක් (symbol) යොදාගෙන ඇත්නම් -t option සමග අදාළ symbol ලබාදෙන්න.

csv-file-sort
sort a csv file

මීලඟ ලිපියෙන් තවත් text processing utilities කිහිපයක් පිලිබඳ සොයා බලමු.

ප්‍රතිචාරයක් ලබාදෙන්න

Fill in your details below or click an icon to log in:

WordPress.com Logo

ඔබ අදහස් දක්වන්නේ ඔබේ WordPress.com ගිණුම හරහා ය. පිට වන්න /  වෙනස් කරන්න )

Twitter picture

ඔබ අදහස් දක්වන්නේ ඔබේ Twitter ගිණුම හරහා ය. පිට වන්න /  වෙනස් කරන්න )

Facebook photo

ඔබ අදහස් දක්වන්නේ ඔබේ Facebook ගිණුම හරහා ය. පිට වන්න /  වෙනස් කරන්න )