#python
#python
Вопрос:
Как я могу извлечь слово из Excel и сделать его отдельным столбцом с помощью Python? Например: текст blow находится на листе Excel, и я хочу извлечь «группу крови» и сделать ее новым cloumn.
Группа крови — O положительная, ВИЧ / HBsAg / HCV — отрицательная
Комментарии:
1. Что вы пробовали до сих пор? Подсказка: Google для
openpyxl
2. Я попытался создать новый столбец и реплицировать весь существующий столбец и пытался отредактировать новый столбец, но у меня ничего не получается.
3. Пожалуйста, покажите код.
4. больница [«Группа крови»]= больница [‘INV’]
5. Группа крови- O Положительный HIV / HBsAg / HCV- отрицательный результат гемограммы / Biochem- WNL. PT — 13,1 на 11/01/2010 сек, INR — 1,05, PT на 12/01/2010 — 12,5 сек. INR — 1 PT на 13/01/2010 — 14,2 INR — 1,15 ЭКГ- ФП, ЧСС- 100 / мин, QRS 96 градусов
Ответ №1:
Итак, предполагая, что ваши данные выглядят следующим образом:
Мы можем сделать:
import pandas as pd
data = pd.read_csv('doc.csv')
и, наконец,
split_by_comma = data.col1.str.split(',').tolist()
blood_group = [lst[0].split('- ')[1] for lst in split_by_comma]
hiv = [lst[1].split('- ')[1] for lst in split_by_comma]
pd.DataFrame({'Blood Group': blood_group, 'HIV/HBsAg/HCV': hiv})
Комментарии:
1. Проблема в том, что у меня почти 3000 строк, и данные не разделены запятыми. В нескольких фрагментах также нет запятой
2. Все в порядке, применяется та же общая идея. Этот код работает для любого количества строк, и вы можете изменять его в зависимости от того, как выглядят ваши данные для правильного разделения. Из приведенного выше требуются только небольшие корректировки.
Ответ №2:
Это зависит от того, что именно вы хотите извлечь. Если это всегда группа крови, вы можете просто использовать срез, если вы хотите извлечь разные слова, тогда вам нужно предоставить более подробную информацию, чтобы кто-нибудь мог вам правильно помочь.
Дайте мне знать более подробную информацию о том, что вы ищете.
Комментарии:
1. Я хочу извлечь «группу крови» из приведенного выше фрагмента данных и сделать ее новым столбцом
2. Группа крови- O Положительный HIV / HBsAg / HCV- отрицательный результат гемограммы / Biochem- WNL. PT — 13,1 на 11/01/2010 сек, INR — 1,05, PT на 12/01/2010 — 12,5 сек. INR — 1 PT на 13/01/2010 — 14,2 INR — 1,15 ЭКГ- ФП, ЧСС- 100 / мин, QRS 96 градусов