[問題] 資料的截取與邏輯判斷
我現在正在處理一些有關於生物資訊的資料
基本上的資料格式長這樣
ID A_1 A_2 B_1 B_2 ……
1 0/0 0/0
2 0/0 ./.
3 ./. ./.
4. 0/0 0/1
5. 1/1 0/1
6. 0/1 0/1
……
接著我想要做幾件事情
依據相同字母的樣本(像是A_1和A_2)
逐列統計四種欄位的數量
1. A_1和A_2相同
2. A_1和A_2都一樣是./.
3. A_1和A_2不一樣
4. 以及任一樣本含有./.的欄位數量
以上表為例
A_1和A_2相同的數量是3 (ID1, 3, 6)
兩行數值都是./.的數量是1
A_1和A_2不同的列有3 (ID2, 4, 5)
有任一行數值為./.的數量為2 (ID2, 3)
然後統計成四個數值這樣並輸出
不過有問題的部分是要如何擷取含有特定字串的兩欄
並逐行進行邏輯判斷?
我知道可以利用awk逐行進行擷取並用grep計算數量並輸出 (不過awk和grep的管線順序還沒參透)
但要如何依據相同字母擷取特定行就不清楚了
想問有甚麼指令可以針對首列帶有特定字串的行進行擷取?
--
Sent from my Windows
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.107.147
※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1530019613.A.AE6.html
→
06/26 22:12,
7年前
, 1F
06/26 22:12, 1F
→
06/26 22:13,
7年前
, 2F
06/26 22:13, 2F
→
06/26 22:14,
7年前
, 3F
06/26 22:14, 3F
→
06/26 22:15,
7年前
, 4F
06/26 22:15, 4F
→
06/26 22:26,
7年前
, 5F
06/26 22:26, 5F
→
06/27 10:31,
7年前
, 6F
06/27 10:31, 6F
推
06/27 11:00,
7年前
, 7F
06/27 11:00, 7F
→
06/27 11:00,
7年前
, 8F
06/27 11:00, 8F
→
06/27 17:39,
7年前
, 9F
06/27 17:39, 9F
→
06/28 11:03,
7年前
, 10F
06/28 11:03, 10F
→
06/28 11:35,
7年前
, 11F
06/28 11:35, 11F
討論串 (同標題文章)
Linux 近期熱門文章
21
56
PTT數位生活區 即時熱門文章