Наилучший способ добавления к большому массиву с неизвестной длиной

#go

#Вперед

Вопрос:

Существует несколько способов добавления к массиву. Интересно, известен ли наилучший способ добавления к огромному массиву (100 МБ) неизвестной длины? Я хочу избежать копирования, поскольку это увеличивает вероятность нехватки памяти и снижает производительность. Должен ли я рассмотреть возможность использования двумерных массивов?

Комментарии:

1. Вы спрашиваете о срезах? Массивы имеют фиксированный размер, который известен во время компиляции.

2. Фрагменты используют массивы, поэтому под капотом то же самое

3. Не то же самое, вы не можете добавить к массиву.

4. Можете ли вы прояснить вопрос? Что такое «массив с неизвестной длиной»? Массив в go имеет известную длину во время компиляции, а фрагмент имеет известную длину во время выполнения. Что вы подразумеваете под добавлением, избегая копирования? Добавление к фрагменту обязательно требует копирования.

5. @Jonas массив имеет фиксированную длину. Почему? Потому что это определено в спецификации. golang.org/ref/spec#Array_types Так что ваш вопрос не имеет смысла.

Ответ №1:

В Golang у нас есть array и slice.


Массивы имеют фиксированный размер, когда вам нужно больше места, вам нужно создать массив большего размера, скопировать все значения из старого массива и заменить старую ссылку на новый массив.

Вы не должны хранить ссылку на старый массив, поэтому в этой памяти будет собран мусор.


В качестве альтернативы вы можете использовать slices (которые являются оболочкой поверх массива). Изменение размера и копирование будут выполнены за вас автоматически.


Вы также можете управлять изменением размера вручную, это может уменьшить GC. Но его следует профилировать и сравнивать с фрагментами.

Я добавил пример с хранением в многомерном массиве, я настоятельно рекомендую избегать этого подхода. Это усложнит и замедлит обход, повысит вероятность утечек памяти и многое другое. Сбор данных в Golang выполняется чрезвычайно быстро.

 BenchmarkStore/array-6            100000         20090 ns/op           0 B/op          0 allocs/op
BenchmarkStore/slice-6              5000        259940 ns/op     4654337 B/op         30 allocs/op
BenchmarkStore/Custom-6            10000        194152 ns/op     1747860 B/op          8 allocs/op
BenchmarkStore/Dimensions-6         3000        418654 ns/op     4458593 B/op         20 allocs/op
  
 package main

import (
    "testing"
)

const size = 100000

// Wrapper around slice
type MyStore struct {
    growthFactor int
    watermark    int
    Data         []int
}

func NewMyStore(growthFactor, initialSize int) *MyStore {
    return amp;MyStore{growthFactor: growthFactor, watermark: -1, Data: make([]int, initialSize)}
}

func (s *MyStore) Append(v int) {
    nextPosition := s.watermark   1
    currentSize := len(s.Data)
    full := currentSize == nextPosition
    if full {
        dataResize := make([]int, currentSize*s.growthFactor)
        copy(dataResize, s.Data)
        s.Data = dataResize
    }

    s.Data[nextPosition] = v
    s.watermark = nextPosition
}

// Dimensions
const chunkSize = 10
type MyStoreMultiDimensions struct {
    size      int
    watermark int
    data      [][chunkSize]int
}

func NewStoreMultiDimensions(chunks int) *MyStoreMultiDimensions {
    return amp;MyStoreMultiDimensions{watermark: -1, data: make([][chunkSize]int, chunks)}
}

func (s *MyStoreMultiDimensions) Append(v int) {
    nextPosition := s.watermark   1
    chunk := nextPosition / chunkSize
    if len(s.data) <= chunk {
        s.data = append(s.data, [chunkSize]int{})
    }

    s.data[chunk][nextPosition%chunkSize] = v
    s.watermark = nextPosition
}

func BenchmarkStore(b *testing.B) {
    b.Run("array", func(b2 *testing.B) {
        for i := 0; i < b2.N; i   {
            var store [size]int
            for item := 0; item < size; item   {
                store[item] = item
            }
        }
    })
    b.Run("slice", func(b2 *testing.B) {
        for i := 0; i < b2.N; i   {
            var store []int
            for item := 0; item < size; item   {
                store = append(store, item)
            }
        }
    })
    b.Run("Custom", func(b2 *testing.B) {
        for i := 0; i < b2.N; i   {
            var store = NewMyStore(4, 10)
            for item := 0; item < size; item   {
                store.Append(item)
            }
        }
    })
    b.Run("Dimensions", func(b2 *testing.B) {
        for i := 0; i < b2.N; i   {
            var store = NewStoreMultiDimensions(2)
            for item := 0; item < size; item   {
                store.Append(item)
            }
        }
    })
}
  

Ответ №2:

По моему мнению, вам следует рассмотреть возможность использования ArrayList вместо array. Затем вы можете использовать add() из ArrayList для добавления новых элементов.