Есть ли способ загрузить некоторый набор данных из R в statsmodels?

#python #r #statsmodels

#python #r #statsmodels

Вопрос:

Я знаю, что к некоторым наборам данных в R-пакетах можно получить доступ с помощью этой техники

 import statsmodels.api as sm
dataset_iris = sm.datasets.get_rdataset(dataname='iris', package='datasets')
  

Я хочу загрузить следующий набор данных по страхованию автомобилей:

 library(insuranceData)
data(dataCar)
  

Есть ли способ загрузить данные?

Попытки

 #df = sm.datasets.get_rdataset('dataCar').data
df = sm.datasets.get_rdataset(dataname='dataCar', package='insuranceData')
ValueError: Dataset dataCar was not found.
  

Комментарии:

1. Рассматривали ли вы rpy2?

2. Я полностью новичок в R, и здесь я просто пытаюсь получить набор данных. Я не пробовал rpy2. Если бы у меня был rpy2, это было бы тривиально, и мы могли бы использовать как r, так и python в одном ноутбуке jupyter. Здесь я только ищу способ получить данные.

Ответ №1:

Если вы используете jupyter notebook, вы можете использовать wget для получения данных, использовать pandas для чтения данных.

 
!wget http://www.businessandeconomics.mq.edu.au/__data/assets/file/0011/232310/car.csv

df = pd.read_csv("car.csv")
df.head()