#excel #vb.net #winforms
#преуспеть #vb.net #winforms
Вопрос:
Моя проблема в том, что мне нужно экспортировать более 90 000 строк / 143 cols из DataGridView (заполненного из базы данных MySQL) в Excel. Что бы я ни делал, я всегда получаю исключение «System.Out.Of.Memory» после 45-60 тыс. строк в зависимости от решения. Я знаю, что могут возникнуть вопросы типа «Зачем вам столько строк», и я бы ответил, что «К сожалению, это необходимо.’ Я искал форумы о своей проблеме, но не нашел никакого рабочего решения. Я попробовал StreamWriter в CSV, обрабатывая данные порциями (решение ниже), также используя несколько файлов Excel или CSV, но ничего не помогло. Каждый раз во время выполнения использование оперативной памяти растет и не освобождается после успешного экспорта, когда я пытаюсь использовать меньшее количество строк. Я не знаю, когда и будет ли освобождена оперативная память после успешного выполнения.
Тестовые машины имеют 8 ГБ оперативной памяти и используют Windows 10. К сожалению, я не могу использовать ресурсы сервера MySQL для обработки экспорта Excel там, а затем вывода файла для совместного использования с пользователем, поэтому мне нужно использовать клиентские компьютеры.
Ниже приведено мое последнее нерабочее решение, в котором данные считываются из DGV и записываются в Excel порциями. Изменение размера блоков не уменьшает потребление памяти, и если я сделаю его меньше (например, от 500 до 2000), единственным эффектом будет то, что экспорт будет замедляться.
Imports Excel = Microsoft.Office.Interop.Excel
Private Sub Button2_Click(sender As Object, e As EventArgs) Handles Button2.Click
If DataGridView1.Rows.Count > 0 Then
Dim filename As String = ""
Dim SV As SaveFileDialog = New SaveFileDialog()
SV.FileName = "Worst_cells"
SV.Filter = "xlsx files (*.xlsx)|*.xlsx|All files (*.*)|*.*"
SV.FilterIndex = 1
SV.RestoreDirectory = True
Dim result As DialogResult = SV.ShowDialog()
If result = DialogResult.OK Then
filename = SV.FileName
Dim XCELAPP As Microsoft.Office.Interop.Excel.Application = Nothing
Dim XWORKBOOK As Microsoft.Office.Interop.Excel.Workbook = Nothing
Dim XSHEET As Microsoft.Office.Interop.Excel.Worksheet = Nothing
Dim misValue As Object = System.Reflection.Missing.Value
XCELAPP = New Excel.Application()
XWORKBOOK = XCELAPP.Workbooks.Add(misValue)
XCELAPP.DisplayAlerts = False
XCELAPP.Visible = False
XSHEET = XWORKBOOK.ActiveSheet
XSHEET.Range("B1").ColumnWidth = 11
For Each column As DataGridViewColumn In DataGridView1.Columns
XSHEET.Cells(1, column.Index 1) = column.HeaderText
Next
Dim rowCnt As Integer = DataGridView1.Rows.Count
Dim colCnt As Integer = DataGridView1.Columns.Count
Dim batchSize As Integer = 10000
Dim currentRow As Integer = 0
Dim valueObjArray As Object(,) = New Object(batchSize - 1, colCnt - 1) {}
While currentRow < rowCnt
Dim rowIndex As Integer = 0
While rowIndex < batchSize AndAlso currentRow rowIndex < rowCnt
For colIndex As Integer = 0 To colCnt - 1
valueObjArray(rowIndex, colIndex) = DataGridView1(colIndex, currentRow rowIndex).Value
Next
rowIndex = 1
End While
Dim colName As String = ColumnLetter(colCnt)
If (currentRow batchSize 1) < rowCnt Then
XSHEET.Range("A" (currentRow 2).ToString(), colName (currentRow batchSize 1).ToString()).Value2 = valueObjArray
Else
XSHEET.Range("A" (currentRow 2).ToString(), colName (rowCnt 1).ToString()).Value2 = valueObjArray
End If
XWORKBOOK.SaveAs(filename)
currentRow = batchSize
End While
XCELAPP.DisplayAlerts = True
XWORKBOOK.Close(False)
XCELAPP.Quit()
Try
System.Runtime.InteropServices.Marshal.ReleaseComObject(XSHEET)
System.Runtime.InteropServices.Marshal.ReleaseComObject(XWORKBOOK)
System.Runtime.InteropServices.Marshal.ReleaseComObject(XCELAPP)
Catch
End Try
GC.Collect()
GC.WaitForPendingFinalizers()
GC.Collect()
GC.WaitForPendingFinalizers()
End If
End If
End Sub
Комментарии:
1. Вы пробовали использовать поставщик Oledb для Excel? Как может быть необходимо 90 000 возможных строк в сетке? Пользователь не может просмотреть 90 000 строк.
2. Я не проверял Oledb. Как вы думаете, стоит ли это проверять? Что касается вашего вопроса, как может понадобиться 90 тысяч строк: представьте, что у вас есть мобильная сеть с более чем 90 тысячами ячеек, и в сети существует серьезная проблема с тысячами жалоб клиентов. В таких обстоятельствах инженер должен быть в состоянии идентифицировать основные вкладчики ячеек, а также иметь возможность просматривать список ячеек после обработки, чтобы найти сдвиги в трафике, снижение ключевых показателей эффективности и т.д.
3. Не уверен, что это имеет значение, но вы не освобождаете ни один из
Range
объектов. Обычно следует избегатьRange r = ...; r.Value2 = ...; Marshal.ReleaseComObject(r);
двойного расставления точек в вашем коде.4. Привязан ли DGV к DataTable? Если это так, рассмотрите возможность извлечения значений из
DataRow.ItemArray
, а не через ячейку DGV.Value, чтобы избежать копирования данных.5. Вы не отвечаете на запросы о дополнительной информации. Вы все еще ищете решение этой проблемы? Я подозреваю, что проблема связана с итерацией строк DGV, что приводит к тому, что они становятся неразделенными и потребляют значительную память. Это можно проверить, запустив пустой
For Each
цикл над коллекцией строк.
Ответ №1:
Подтверждено, что использование Marshal.ReleaseComObject(...);
на Range
объектах устраняет OutOfMemory
исключение. Ниже приведен код, используемый для тестирования. Вам придется заменить пару строк кода на свои собственные. Первая часть кода заключается в генерации большого количества случайных данных. Вторая часть записывает DataTable
строки по частям. Установив xls.Visible = true;
, вы можете видеть, как Excel обрабатывает каждый фрагмент с индикатором выполнения в нижней части окна Excel.
public static void TestExcel(String filename, int maxRows) {
int numCols = 100;
Type[] availTypes = new Type[] { typeof(bool), typeof(int), typeof(double), typeof(String), typeof(DateTime) };
Type[] types = new Type[numCols];
Random r = new Random();
DataTable table = new DataTable();
for (int i = 0; i < numCols; i ) {
Type ty = availTypes[r.Next(availTypes.Length)];
types[i] = ty;
table.Columns.Add("Col" i, ty);
}
DateTime minDate = new DateTime(1901,01,01);
for (int i = 0; i < maxRows; i ) {
Object[] arr2 = new Object[numCols];
for (int j = 0; j < numCols; j ) {
Object o = null;
Type ty = types[j];
if (ty == typeof(bool))
o = (r.Next(2) == 0 ? false : true);
else if (ty == typeof(int))
o = r.Next(int.MinValue, int.MaxValue);
else if (ty == typeof(double))
o = r.NextDouble();
else if (ty == typeof(String)) {
int len = r.Next(0, 256);
char c = ExcelUtils.ToLetters(r.Next(26))[0];
o = new String(c, len);
}
else if (ty == typeof(DateTime))
o = minDate.AddSeconds(r.Next(int.MaxValue));
arr2[j] = o;
}
table.Rows.Add(arr2);
}
XlFileFormat format = XlFileFormat.xlWorkbookDefau<
if (File.Exists(filename))
File.Delete(filename);
DateTime utcNow = DateTime.UtcNow;
Workbook wb = null;
Worksheet ws = null;
Excel xls = new Excel(); // replace with Application.Excel
xls.Visible = true;
xls.DisplayAlerts = false;
if (xls.Workbooks.Count == 0)
wb = xls.Workbooks.Add();
else
wb = xls.Workbooks[1];
if (wb.Worksheets.Count == 0)
ws = wb.Worksheets.Add();
else
ws = wb.Worksheets[1];
int maxCellsPerInsert = 1000000; // inserting too much data at once results in an out of memory exception
int batchSize = maxCellsPerInsert / table.Columns.Count;
int fromIndex = 0;
int n = table.Rows.Count;
while (fromIndex < n) {
int toIndex = Math.Min(fromIndex batchSize, n);
Range r0 = ws.get_Range("A" (fromIndex 1));
Object[,] arr = DataTableUtils.ToObjectArray(table, false, true, null, fromIndex, toIndex); // replace with your own arr[,] code
Range r00 = r0.Resize(arr.GetLength(0), arr.GetLength(1));
r00.Value = arr;
r00.Dispose(); // replace with Marshal.Release
r0.Dispose(); // replace with Marshal.Release
fromIndex = toIndex;
}
wb.SaveAs(filename, format, AccessMode: XlSaveAsAccessMode.xlNoChange);
wb.Close(false, filename, null);
xls.Quit(false, false);
long length = FileEx.GetFileLengthFast(filename);
double totalSeconds = (DateTime.UtcNow - utcNow).TotalSeconds;
String message = "NumRows: " maxRows " duration: " Math.Round(totalSeconds, 1) " seconds. File length: " length " rows/sec: " Math.Round(1.0* maxRows / totalSeconds);
}
Комментарии:
1. Вчера я попробовал ваше предложение из комментариев в моем первоначальном сообщении о выпуске объекта Range (см. Ниже). К сожалению, это не изменило потребление памяти и снова закончилось исключением. Я постараюсь изменить ваш новый код для своих нужд. Спасибо вам! Мой измененный код, который не помог (строки разделены символом ;):
Dim r As Excel.Range = XSHEET.Range("A" (currentRow 2).ToString(), colName (currentRow batchSize 1).ToString()); r.Value2 = valueObjArray; System.Runtime.InteropServices.Marshal.ReleaseComObject(r)
2. @Ivaylo Отредактируйте свой первоначальный вопрос и поместите весь обновленный код. Ваш исходный код вызывается
SaveAs
после каждого фрагмента, который не нужен.3. Кроме того, максимальный размер пакета строк должен составлять 6 993 (на основе 1 миллиона ячеек / 143 столбцов). Если бы ваше тестирование все еще использовало 10000, это объяснило бы исключение.
4. В вашем коде есть и другие места, которые не освобождают объекты, например:
XSHEET.Range("B1").ColumnWidth = 11
иXSHEET.Cells(1, column.Index 1)
5. Я опубликую обновленный код в качестве дополнительного ответа. Похоже, проблема заключалась в самом DGV, особенно в чтении его значений, которые, по-видимому, остались в памяти. Экспорт таблицы данных за DGV решил проблему. Я не тестировал только с сохранением и избегал сохранения. Мои тесты не показали никаких изменений при удалении диапазона Excel, но я сохранил их в коде на всякий случай.
Ответ №2:
После долгих испытаний и помощи других пользователей (особенно ненавистных) Я обнаружил, что экспортировать большой DataGridView в Excel без исключения исключения из памяти невозможно при стандартном подходе (я не тестировал Oledb или Xml). Рабочим решением для меня было экспортировать саму datatable, которая была источником данных для DGV. Пожалуйста, обратите внимание, что такое решение подходит, когда вы выполняете экспорт в том же процессе сразу после заполнения DGV данными. В противном случае, если вы захотите экспортировать данные впоследствии, например, после нажатия кнопки, вам нужно будет объявить datatable как общедоступный, чего я бы не стал делать. Похоже, что сбой памяти, который происходит при экспорте непосредственно из DGV, заключается в том, что после считывания фрагментов данных из DGV и последующего копирования их в Excel range, эти фрагменты остаются в памяти (я не знаю, почему это так). Одним из ключевых моментов в этом решении является то, что чтение из datatable и последующая запись в Excel выполняются пакетно. Мой случай заключается в том, что мне нужно экспортировать более 90 000 строк в Excel. Для 90 000 строк я использовал размер пакета в 25 000 строк, который отлично работал для 90 тыс. ячеек. Но для большего количества строк, таких как 270k или 360k, которые я тестировал, я использовал меньшее значение пакета в 10000 строк. Это потому, что моя WinForm уже перегружена памятью, отображая большой DGV. Итак, если в DGV есть 270 тыс. строк, то экспорт с пакетом из 25 000 запускает исключение. Но с 10.000 это было нормально, хотя время экспорта больше. Что касается времени экспорта: 90 тыс. строк с пакетом из 25 тыс. заняли в моей среде 1 мин 05 сек; 270 тыс. строк с пакетом из 10 тыс. заняли 9 минут, а 360 тыс. строк с пакетом из 10 тыс. заняли 15 минут.
Dim filename As String = ""
Dim SV As SaveFileDialog = New SaveFileDialog()
SV.FileName = "Excel export"
SV.Filter = "xlsx files (*.xlsx)|*.xlsx|All files (*.*)|*.*"
SV.FilterIndex = 1
SV.RestoreDirectory = True
Dim result As DialogResult = SV.ShowDialog()
If result = DialogResult.OK Then
filename = SV.FileName
Dim xcelApp As Microsoft.Office.Interop.Excel.Application = Nothing
Dim xWorkbook As Microsoft.Office.Interop.Excel.Workbook = Nothing
Dim xSheet As Microsoft.Office.Interop.Excel.Worksheet = Nothing
Dim misValue As Object = System.Reflection.Missing.Value
xcelApp = New Excel.Application()
xWorkbook = xcelApp.Workbooks.Add(misValue)
xcelApp.DisplayAlerts = False
xcelApp.Visible = False
xSheet = xWorkbook.ActiveSheet
xSheet.Range("B1").ColumnWidth = 11
'export column headers to Excel is shown below
Dim i As Integer = 1
For Each column As DataColumn In dataTab.Columns
xSheet.Cells(1, i) = column.ColumnName
i = i 1
Next
Dim rowCnt As Integer = dataTab.Rows.Count
Dim colCnt As Integer = dataTab.Columns.Count
Dim batchSize As Integer = 10000 'export will de done in batches
Dim startRow As Integer = 0 'starting row for each batch
Dim valueObjArray As Object(,) = New Object(batchSize - 1, colCnt - 1) {}
'object array with a size of the batch x number of columns
While startRow < rowCnt 'iterate until max row number is exceeded
Dim rowIndex As Integer = 0
'iterate each until row index reaches batch size
While rowIndex < batchSize AndAlso startRow rowIndex < rowCnt
'iterate each cell in the row until last column is reached
'and assign the value of the cell in datatable to the object array
For colIndex As Integer = 0 To colCnt - 1
valueObjArray(rowIndex, colIndex) =
dataTab.Rows(startRow rowIndex).Item(colIndex)
Next
rowIndex = 1 'go to new row
End While
Dim colName As String = ColumnLetter(colCnt) 'transform column index to Excel column name
'("if" below) assign object array to Excel range if batch range starting row is less than total rows
If (startRow batchSize 1) < rowCnt Then
Dim r As Excel.Range = xSheet.Range("A" (startRow 2).ToString(),
colName (startRow batchSize 1).ToString())
r.Value2 = valueObjArray
System.Runtime.InteropServices.Marshal.ReleaseComObject(r) 'this might be not needed
Else 'if batch range starting row is more than total rows assign to Excel range only the remaining rows
Dim r As Excel.Range = xSheet.Range("A" (startRow 2).ToString(),
colName (rowCnt 1).ToString())
r.Value2 = valueObjArray
System.Runtime.InteropServices.Marshal.ReleaseComObject(r) 'this might be not needed
End If
xWorkbook.SaveAs(filename)
startRow = batchSize
End While
xcelApp.DisplayAlerts = True
xWorkbook.Close(False)
xcelApp.Quit()
Try
System.Runtime.InteropServices.Marshal.ReleaseComObject(xSheet)
System.Runtime.InteropServices.Marshal.ReleaseComObject(xWorkbook)
System.Runtime.InteropServices.Marshal.ReleaseComObject(xcelApp)
Catch
End Try
GC.Collect()
GC.WaitForPendingFinalizers()
GC.Collect()
GC.WaitForPendingFinalizers()
End If
Ниже приведена функция преобразования индекса столбца в имя столбца Excel.
Function ColumnLetter(ColumnNumber As Long) As String
Dim n As Long
Dim c As Byte
Dim s As String
n = ColumnNumber
Do
c = ((n - 1) Mod 26)
s = Chr(c 65) amp; s
n = (n - c) 26
Loop While n > 0
ColumnLetter = s
End Function